Eine 4-stufige Wissensdatenbank-Architektur zur Verbesserung der Genauigkeit von KI-Agenten

Ein Entwickler auf r/openclaw beschrieb eine Architektur für eine strukturierte Wissensdatenbank, die generische LLM-Agenten durch die Bereitstellung spezifischen Kontexts zu Tools, Workflows und Richtlinien zu Domänenexperten machen soll.
Das Problem mit gängigen RAG-Ansätzen
Die Quelle identifiziert mehrere Probleme bei typischen RAG-Implementierungen: keine Abfrageklassifizierung (jede Frage durchläuft dieselbe Retrieval-Pipeline), keine Abstufung (Governance-Dokumente werden wie Blogposts behandelt), kein Budget (Agenten-Kontextfenster wird mit irrelevanten Textabschnitten überladen) und keine Selbstheilung (veraltete/defekte Dokumente bleiben dauerhaft defekt).
Eine 4-stufige KB-Pipeline
Das System verwendet vier verschiedene Stufen:
- Governance-Stufe — Immer geladen. Enthält Agenten-Identität, Richtlinien und Regeln als nicht verhandelbaren Kontext.
- Agenten-Stufe — Dokumentation pro Agent. Beispielsweise erhält ein Sprachagent namens Lucy Dokumente zur Anrufbehandlung, während ein Agent namens Binky (CRO) Dokumente zur Konversionsoptimierung erhält.
- Relevanz-Stufe — Dynamisches Retrieval pro Abfrage mit Titel-/Textabgleich, begrenzt auf maximal 5 Dokumente und ein Budget von 12.000 Zeichen pro Dokument.
- Wiki-Stufe — Über 200 Referenzartikel, die über eine Dateisystembrücke durchsuchbar sind und KI-Geschichte, Tool-Definitionen, Workflow-Muster und Plattformvergleiche abdecken.
Abfrageklassifizierung als Geheimwaffe
Vor jedem Retrieval bestimmt ein regex-basierter Klassifizierer, wie viel Kontext eine Frage benötigt:
- DIRECT — Für Aufgaben wie „Fasse diesen Text zusammen“, bei denen keine Wissensdatenbank benötigt wird.
- SKILL_ONLY — Für Aufgaben wie „Schreibe mir einen Tweet“, bei denen die Skill-Dokumentation des Agenten ausreicht.
- HOT_CACHE — Für Fragen wie „Wer bearbeitet die Abrechnung?“, die aus Governance- und Agenten-Dokumenten im Speicher-Cache beantwortet werden.
- FULL_RAG — Für komplexe Abfragen wie „Vergleiche n8n vs. Zapier Preise“, die eine vollständige Vektorsuche und Wiki-Brücke erfordern.
Diese Klassifizierung allein soll die Token-Kosten um etwa 40 % gesenkt haben, da die meisten Fragen kein vollständiges RAG benötigen.
KB-Struktur und Organisation
Jeder der über 200 Artikel folgt einem einheitlichen Format: ein klarer Titel mit Umfang, praktischer Inhalt (Tabellen, Codebeispiele, Entscheidungsrahmen), 2+ zitierte Quellen mit echten URLs, 5 Bildreferenzbeschreibungen und 2 Videoreferenzen.
Der Inhalt ist in spezifische Domänen organisiert:
- KI/ML-Grundlagen (18 Artikel) — Geschichte, Transformer, Embeddings, Agenten
- Tooling (16 Artikel) — Definitionen, Sicherheit, Taxonomie, Fehlerbehandlung, Audit
- Workflows (18 Artikel) — Typen, Plattformen, Kostenanalyse, HIL-Muster
- Bildgenerierung (115 Dateien) — 16 Anbieter, Vergleiche, Prompt-Frameworks
- Videogenerierung (109 Dateien) — Behandlungen, Pipelines, Plattformleitfäden
- Support (60 Artikel) — Kundenhilfezentrum-Inhalte
Selbstheilendes System
Die Architektur umfasst ein Bewertungssystem, das die KB-Gesundheit auf einer Skala von 0–100 bewertet und Probleme automatisch behebt: Fehlende Embeddings lösen Neu-Embedding aus, veraltete Inhalte werden zur Aktualisierung markiert, und defekte Referenzen werden repariert oder entfernt. Der Gesundheitswert soll sich nach dem ersten Heilungsdurchlauf von 71 auf 89 verbessert haben.
Ergebnisse und wichtige Erkenntnisse
Vor der KB-Implementierung halluzinierten Agenten Tool-Definitionen, erfanden Preise und gaben generische Workflow-Ratschläge. Nach der Implementierung zitieren Agenten spezifische Dokumente, liefern genaue Plattformvergleiche mit echten Preisen und wissen, wann sie sagen müssen: „Ich habe dazu keine aktuellen Daten.“
Wichtige Erkenntnisse aus der Implementierung:
- Klassifiziere vor dem Retrieval — nicht jede Frage benötigt RAG.
- Budgetiere dein Kontextfenster — 60.000 Zeichen insgesamt, mit einer festen Obergrenze pro Dokument.
- Struktur schlägt Volumen — 200 gut organisierte Artikel sind besser als 10.000 zufällige Textabschnitte.
- Selbstheilung ist nicht optional — Wissensdatenbanken zerfallen, daher baue von Tag eins an Monitoring auf.
- Schreibe für Agenten, nicht für Menschen — priorisiere Tabellen gegenüber Absätzen, Entscheidungsrahmen gegenüber Prosa und konkrete Beispiele gegenüber abstrakten Erklärungen.
📖 Read the full source: r/openclaw
👀 Siehe auch

Pilot-Protokoll: Ein P2P-Netzwerk-Stack für KI-Agenten, entwickelt mit Claude
Ein Entwickler hat das Pilot Protocol entwickelt, einen reinen User-Space-Peer-to-Peer-Virtual-Network-Stack in Go, speziell für autonome KI-Agenten, der direkte Kommunikation ohne zentrale Infrastruktur ermöglicht. Das Protokoll nutzt UDP-Multiplexing, NAT-Traversal und Ende-zu-Ende-Verschlüsselung, mit Benchmarks, die einen lokalen Durchsatz von 89 MB/s und einen transkontinentalen WAN-Durchsatz von 2,1 MB/s zeigen.

PACT 0.4.0 fügt zusammengesetzte Intelligenz für KI-Coding-Agenten hinzu.
PACT (Programmatic Agent Constraint Toolkit) Version 0.4.0 führt zusammengesetzte Intelligenzfunktionen ein, die KI-Codierungsagenten helfen, Wissen über Sitzungen hinweg zu behalten. Das Update umfasst Forschungssynthese, ein Wissensverzeichnis und Systeme zur Fähigkeitsselbsterkenntnis.

Claudes Canva-Integration: Ein praktischer Workflow zur Design-Generierung
Claudes Canva-Konnektor exportiert bearbeitbare Canva-Projekte mit strukturierten Layouts, keine flachen Bilder. Der Beitrag beschreibt einen Workflow von der Eingabeaufforderung bis zum fertigen Karussell in 12-15 Minuten, einschließlich Einrichtung, High-Fidelity-Modus und ehrlichen Einschränkungen.

ai-codex: Indizieren Sie Ihre Codebasis im Voraus, um Claude-Tokens zu sparen
ai-codex ist ein Tool, das kompakte Markdown-Indizes Ihres Codebestands generiert, sodass Claude Code die anfängliche Erkundungsphase überspringen kann, die normalerweise 30-50K Tokens pro Konversation verbraucht. Es erstellt fünf Dateien, die Routen, Seiten, Bibliotheken, Schemata und Komponenten abdecken.