Automatisierung der Datadog-Alarmtriage mit Claude Code und MCP

Ein Entwickler bei Quickchat hat ein automatisiertes System zur Bearbeitung der morgendlichen Datadog-Alarmtriage mit Claude Code und dem Model Context Protocol (MCP) erstellt. Das System eliminiert die manuelle Prüfung von Datadog-Dashboards, indem KI-Agenten Alarme analysieren, Probleme klassifizieren und Pull Requests mit Korrekturen öffnen.
Einrichtungskomponenten
Die Implementierung umfasst drei Hauptkomponenten:
1. Datadog MCP-Server-Integration
Datadog stellt einen Remote-MCP-Server mit OAuth-Authentifizierung bereit. Die Konfiguration erfordert eine Datei im Repository-Stammverzeichnis:
// .mcp.json
{
"mcpServers": {
"datadog": {
"type": "http",
"url": "https://mcp.datadoghq.eu/api/unstable/mcp-server/mcp"
}
}
}
Entwickler authentifizieren sich mit einem einzigen Browserklick. Für Benutzer der US1-Region ersetzen Sie datadoghq.eu durch datadoghq.com.
2. Claude Code Skill für Triage
Eine Skill-Datei unter .claude/skills/triage-datadog definiert den Triage-Workflow in vier Phasen:
- Sammeln: Prüfen Sie Datadog auf Monitore, Fehlerprotokolle und Vorfälle der letzten 24 Stunden
- Klassifizieren: Sortieren Sie die Ergebnisse in drei Kategorien: Handlungsbedarf (Code-Fehler), Infrastruktur (Serverprobleme) und Rauschen (vorübergehende Störungen)
- Beheben: Für jeden echten Fehler starten Sie einen KI-Agenten in einem isolierten Git-Worktree, um Ursachen zu finden, Korrekturen mit Tests zu schreiben und PRs zu öffnen
- Berichten: Fassen Sie die Ergebnisse in einem Tabellenformat zusammen
Agenten laufen parallel, um sequenzielles Warten zu vermeiden.
3. Cron-Job-Automatisierung
Das System läuft automatisch an Wochentagen um 8 Uhr morgens mit diesem Crontab-Eintrag:
3 8 * * 1-5 claude -p --dangerously-skip-permissions '/triage-datadog'
Das Flag -p gibt die Ausgabe ohne Konversation aus, und --dangerously-skip-permissions erlaubt dem Agenten, ohne menschliche Genehmigung für jede Dateilesung fortzufahren. Jeder Agent läuft in einer abgeschotteten Macbox-Sitzung mit begrenzten Git-Worktrees, ohne Zugriff auf Produktionsinfrastruktur, Geheimnisse oder Bereitstellungspipelines.
Für zusätzliche Sicherheit können Tools mit einer expliziten Whitelist eingeschränkt werden:
claude -p --dangerously-skip-permissions --allowedTools "Bash(git:*) Bash(gh:*) Edit Read Grep Glob Agent" '/triage-datadog'
Der Entwickler berichtet, dass die gesamte Einrichtung etwa 30 Minuten zur Implementierung dauerte.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Open-Foundry: Ein Framework für Multi-Agenten-Debatten mit Claude Code
Open-foundry ist ein Python-Framework, das mehrere Claude Code-Agenten zu einem Gremium zusammenstellt, um komplexe Fragen zu debattieren, und dabei vollständig einsehbare Argumentationspfade mit Transkripten, Orchestrator-Protokollen und Arbeitsnotizen pro Agent erzeugt.

Benutzerdefinierte Reddit MCP für Claude Desktop/Code auf GitHub geteilt
Ein Entwickler hat ein selbst erstelltes Reddit MCP veröffentlicht, das speziell für Claude Desktop und Claude Code entwickelt wurde, um Reddit-Recherchen direkt in den Arbeitsablauf zu integrieren. Das Tool ist auf GitHub dokumentiert und steht kostenlos zur Verfügung.

Ops Dashboard OpenClaw: Lokales Dashboard für Solo-Entwickler mit mehreren Repos
Ein Solo-Entwickler hat ops-dashboard entwickelt, eine lokale App, die Obsidian-Vaults, Repos und Logs in ein einziges durchsuchbares Dashboard integriert. BYOK, MIT-lizenziert, keine Cloud erforderlich.

Claude Code HUD: Terminal-Dashboard zur Überwachung von KI-Codierungssitzungen
claude-code-hud ist ein Terminal-Dashboard, das Echtzeit-Überwachung für Claude Code-Sitzungen bietet und die Nutzung des Kontextfensters, API-Ratenlimits und Dateiänderungen anzeigt, ohne eine IDE zu benötigen. Starten Sie es mit npx claude-code-hud.