Autonomas 18-monatige Neuentwicklung des Codebase: Lehren über Tests, technische Schulden und Server Actions

Warum ein erfolgreiches Produkt eine komplette Neuerstellung benötigte
Autonoma, ein Unternehmen, das mehrfach die Richtung änderte (Enterprise-Suche, Dokumentengenerierung, Coding-Agent, QA-Testplattform), entwickelte über 1,5 Jahre ein Produkt, gewann Kunden, erhielt Finanzierung von einem großen Branchenakteur und baute ein Team von 14 Personen auf. Trotz dieser positiven Entwicklung entschied sich das Unternehmen, die gesamte Codebasis zu verwerfen und von vorne zu beginnen.
Die Ära ohne Tests und ihre Folgen
Anfangs nutzte das Team ein TypeScript-Monorepo ohne strikten Modus und ohne Tests. Das funktionierte mit 2 Ingenieuren, die große Teile der Codebasis verantworteten, wurde aber nach weiteren Einstellungen katastrophal. Die Codebasis entwickelte Null-Probleme, undefiniertes Verhalten und schlechte Fehlerbehandlung, was zu Bugs führte, die „aus dem Nichts“ auftauchten, und sogar zum Verlust eines Kunden. Der Gründer verbot zunächst Tests, um eine Kultur des schnellen Auslieferns zu bewahren, erkannte später aber, dass dies Produktqualität und Produktivität beeinträchtigte.
Technische Entscheidungen, die zur Neuerstellung führten
Das ursprüngliche Produkt wurde in der GPT-4-Ära (nicht 4o) entwickelt, als Modelle umfangreiche Schutzmaßnahmen benötigten. Sie bauten ausgeklügelte Playwright- und Appium-Wrapper mit komplexen Inspektionen und 7 Klickstrategien, die sich selbstständig reparierten. Mit den Fortschritten der Modelle ist diese ausgefeilte Inspektion nicht mehr nötig, was die Legacy-Codebasis mit technischer Schuld weniger wertvoll macht.
Abschied von Next.js und Server Actions
Das Team entfernt sich von Next.js und Server Actions und nennt mehrere Probleme:
- Server Actions sind asynchron und erfordern useEffect-Blöcke oder manuelle State-Verwaltung in React
- Sie sind schwer zu testen – Tests erfordern das Erstellen von Prisma-Objekten mit In-Memory-Datenbanken oder Mocking
- Keine Dependency-Injection-Fähigkeit
- Sie werden global sequenziell ausgeführt, was einen „künstlichen Python Global Interpreter Lock, aber in TypeScript“ erzeugt
Die neue Implementierung beginnt von Grund auf mit Tests und nutzt den striktesten TypeScript-Modus.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Wenn jeder KI hat, aber das Unternehmen trotzdem nichts lernt: Das unordentliche Mittelfeld der Unternehmens-KI-Einführung
Ethan Mollicks Rahmenwerk zeigt, dass individuelle Produktivitätsgewinne durch KI nicht automatisch zu organisationalem Lernen werden. Der Artikel untersucht, warum Unternehmen in einer 'unordentlichen Mitte' feststecken, in der KI-Nutzung uneinheitlich, versteckt und vom gemeinsamen Wissen abgekoppelt ist.

Agent-Monetarisierungsmethoden getestet: Schnellstes Ergebnis in 80 Sekunden
OpenClaw-Reporter testeten mehrere Agenten-Monetarisierungsmethoden, darunter selbstverwaltete Wallets, Vorhersagemärkte, DeFi-Yield-Farming, Bounty-Hunting und Mikrozahlungen. Das schnellste Ergebnis war 80 Sekunden von null zu einer finanzierten Nano-Wallet über MCP ohne API-Schlüssel, SDK oder menschliche Einrichtung.

OpenClaw Codex OAuth gibt trotz gültigem Konto Abrechnungsfehler zurück
OpenClaw Codex OAuth gibt einen 429-Fehler zurück, der besagt: 'Ihr Konto ist nicht aktiv, bitte überprüfen Sie Ihre Abrechnungsdetails', obwohl die Abrechnung als gültig bestätigt wurde und der exec-Befehl funktioniert. Das Problem tritt über mehrere OpenClaw-Versionen hinweg auf.

Claude Opus 4.7 markiert Hantavirus-Impfstoff-Fragen als Sicherheitsrisiko und stoppt Chats
Wenn man Claude Opus 4.7 fragt, wie man einen Hantavirus-Impfstoff entwickelt, löst das Sicherheitsfilter aus, die den Chat pausieren, während Sonnet 4.6 ebenfalls ähnliche prädiktive Modellierung blockiert.