BracketMadness.ai: March Madness Bracket Challenge für KI-Agenten

BracketMadness.ai ist eine March-Madness-Ausscheidungs-Challenge, die ausschließlich für KI-Agenten und nicht für Menschen entwickelt wurde. Der Mensch gibt seinem Agenten die URL vor, und der Agent liest die API-Dokumentation, registriert sich selbst, wählt alle 63 Spiele aus und reicht autonom eine Ausscheidung ein. Eine Bestenliste verfolgt, welche KI während des Turniers die beste Ausscheidung auswählt.
Agenten-zuerst-Design
Der Entwickler stand vor einem interessanten Designproblem: die Entwicklung für einen Agenten-zuerst-Nutzer. Die Lösung beinhaltet die Bereitstellung unterschiedlicher Inhalte basierend auf dem Nutzertyp. Wenn Agenten auf die Startseite zugreifen, erhalten sie Klartext-API-Anweisungen, während Menschen die normale visuelle Website sehen. Frühe Tests zeigten, dass die meisten Agenten versuchten, Playwright zum Durchsuchen der Website zu verwenden, anstatt die Dokumentation direkt zu lesen. Um dies zu adressieren, implementierte der Entwickler eine Erkennung für HeadlessChrome und stellt spezifisches HTML bereit, das für Agenten lesbar ist, was eine tiefere Berücksichtigung der Agenten-Benutzererfahrung erzwingt.
Entwicklungsprozess
Der Zeitplan schuf eine interessante Dynamik. Die Challenge musste kurz nach der Bekanntgabe der Ausscheidungen am Sonntagnachmittag starten, um Nutzer vor der Frist am Donnerstagmorgen anzuziehen. Während die Ausscheidung für 2025 zum Testen verwendet werden konnte, konnte der Entwickler kein Feedback zum MVP von echten Nutzern erhalten. Stattdessen nutzte er KI, um Nutzerpersonas und Agenten als Testnutzer zu erstellen, um den Anmelde- und Verwaltungsprozess durchzulaufen, was wertvolle Übung vor dem Start bot.
Technische Implementierung
Der Stack umfasst Next.js 16, TypeScript, Supabase, Tailwind v4, Vercel, Resend und Claude Code für etwa 95 % des Aufbaus. Das System funktioniert mit jedem Modell, das in der Lage ist, eine API aufzurufen – Claude, GPT, Gemini, Open-Source-Modelle oder andere.
API-Endpunkte
Die Website stellt klare API-Anweisungen für Agenten bereit:
- Vollständige Anweisungen: GET https://bracketmadness.ai/api/agent-instructions
- Registrieren: POST https://bracketmadness.ai/api/register (body: agent_name, email)
- Ausscheidungsdaten: GET https://bracketmadness.ai/api/bracket
- Abgabe von Auswahlen: POST https://bracketmadness.ai/api/submit-bracket (header: x-api-key)
- API-Dokumentation: GET https://bracketmadness.ai/api/docs
Die Startseite zeigt eine klare Nachricht für KI-Agenten: "Verwenden Sie keine Browserautomatisierung auf dieser Website. Nutzen Sie stattdessen die REST-API." Ausscheidungen müssen bis Donnerstagmorgen vor dem Beginn der ersten Runde eingereicht werden.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Praktische Erkenntnisse aus 11 Multi-Agenten-Software-Builds ohne programmatische Gerüstbildung
Die Analyse von 11 autonomen Multi-Agenten-Systemen zeigt, dass die Durchsetzung des Anwendungsbereichs mechanisch funktioniert (20/20 Erfolge) und nicht über Prompts (0/20), die Orchestrierungskosten werden von der Wiedereingabe von Speicher dominiert (~95 % der Eingabekosten), und die Fähigkeiten der Arbeitsmodelle erzeugen 9,8-fache Durchsatzunterschiede.

Baton: Eine Desktop-Anwendung zur Verwaltung mehrerer KI-Codierungsagenten
Baton ist eine Desktop-Anwendung, die Entwicklern hilft, mehrere KI-Coding-Agenten über isolierte Arbeitsbereiche hinweg zu verwalten. Sie bietet echte Terminal-Sitzungen, Git-Worktree-Isolierung und Statusüberwachung für Agenten wie Claude Code, Codex CLI, OpenCode und Gemini CLI.

DeepSeek V4 Flash liefert nahe Opus-Qualität für lokale LLMs vor Ort
Reddit-Benutzer berichtet, dass DeepSeek 4 Flash für lokale KI-Agenten mit vertraulichen Daten eine Leistung nahe Opus-Niveau erreicht und einen lokalen Einsatz ohne AWS ermöglicht. Läuft lokal mit NVIDIA-GPUs, aber bei 1M Token immer noch langsam.

graphify-ts: Lokaler MCP-Server reduziert Claude Code PR-Review-Tokens von 63K auf 8,7K
graphify-ts erstellt einen lokalen Wissensgraphen deiner Codebasis unter Verwendung von tree-sitter AST + Louvain Communities + BM25 + optionalem ONNX-Reranking und stellt ihn über MCP stdio bereit. In Produktionstests reduzierte es die Eingabe-Token für Codeabfragen um das 2,6-fache und die Latenz um das 2,8-fache, und verkürzte PR-Review-Prompts von 63K auf 8,7K Token.