4-Stufige Wissensdatenbank-Architektur: KI-Agenten-Genauigkeit verbessern

Ein Entwickler auf r/openclaw beschrieb eine Architektur für eine strukturierte Wissensdatenbank, die generische LLM-Agenten durch die Bereitstellung spezifischen Kontexts zu Tools, Workflows und Richtlinien zu Domänenexperten machen soll.

Das Problem mit gängigen RAG-Ansätzen

Die Quelle identifiziert mehrere Probleme bei typischen RAG-Implementierungen: keine Abfrageklassifizierung (jede Frage durchläuft dieselbe Retrieval-Pipeline), keine Abstufung (Governance-Dokumente werden wie Blogposts behandelt), kein Budget (Agenten-Kontextfenster wird mit irrelevanten Textabschnitten überladen) und keine Selbstheilung (veraltete/defekte Dokumente bleiben dauerhaft defekt).

Eine 4-stufige KB-Pipeline

Das System verwendet vier verschiedene Stufen:

Governance-Stufe — Immer geladen. Enthält Agenten-Identität, Richtlinien und Regeln als nicht verhandelbaren Kontext.
Agenten-Stufe — Dokumentation pro Agent. Beispielsweise erhält ein Sprachagent namens Lucy Dokumente zur Anrufbehandlung, während ein Agent namens Binky (CRO) Dokumente zur Konversionsoptimierung erhält.
Relevanz-Stufe — Dynamisches Retrieval pro Abfrage mit Titel-/Textabgleich, begrenzt auf maximal 5 Dokumente und ein Budget von 12.000 Zeichen pro Dokument.
Wiki-Stufe — Über 200 Referenzartikel, die über eine Dateisystembrücke durchsuchbar sind und KI-Geschichte, Tool-Definitionen, Workflow-Muster und Plattformvergleiche abdecken.

Abfrageklassifizierung als Geheimwaffe

Vor jedem Retrieval bestimmt ein regex-basierter Klassifizierer, wie viel Kontext eine Frage benötigt:

DIRECT — Für Aufgaben wie „Fasse diesen Text zusammen“, bei denen keine Wissensdatenbank benötigt wird.
SKILL_ONLY — Für Aufgaben wie „Schreibe mir einen Tweet“, bei denen die Skill-Dokumentation des Agenten ausreicht.
HOT_CACHE — Für Fragen wie „Wer bearbeitet die Abrechnung?“, die aus Governance- und Agenten-Dokumenten im Speicher-Cache beantwortet werden.
FULL_RAG — Für komplexe Abfragen wie „Vergleiche n8n vs. Zapier Preise“, die eine vollständige Vektorsuche und Wiki-Brücke erfordern.

Diese Klassifizierung allein soll die Token-Kosten um etwa 40 % gesenkt haben, da die meisten Fragen kein vollständiges RAG benötigen.

KB-Struktur und Organisation

Jeder der über 200 Artikel folgt einem einheitlichen Format: ein klarer Titel mit Umfang, praktischer Inhalt (Tabellen, Codebeispiele, Entscheidungsrahmen), 2+ zitierte Quellen mit echten URLs, 5 Bildreferenzbeschreibungen und 2 Videoreferenzen.

Der Inhalt ist in spezifische Domänen organisiert:

KI/ML-Grundlagen (18 Artikel) — Geschichte, Transformer, Embeddings, Agenten
Tooling (16 Artikel) — Definitionen, Sicherheit, Taxonomie, Fehlerbehandlung, Audit
Workflows (18 Artikel) — Typen, Plattformen, Kostenanalyse, HIL-Muster
Bildgenerierung (115 Dateien) — 16 Anbieter, Vergleiche, Prompt-Frameworks
Videogenerierung (109 Dateien) — Behandlungen, Pipelines, Plattformleitfäden
Support (60 Artikel) — Kundenhilfezentrum-Inhalte

Selbstheilendes System

Die Architektur umfasst ein Bewertungssystem, das die KB-Gesundheit auf einer Skala von 0–100 bewertet und Probleme automatisch behebt: Fehlende Embeddings lösen Neu-Embedding aus, veraltete Inhalte werden zur Aktualisierung markiert, und defekte Referenzen werden repariert oder entfernt. Der Gesundheitswert soll sich nach dem ersten Heilungsdurchlauf von 71 auf 89 verbessert haben.

Ergebnisse und wichtige Erkenntnisse

Vor der KB-Implementierung halluzinierten Agenten Tool-Definitionen, erfanden Preise und gaben generische Workflow-Ratschläge. Nach der Implementierung zitieren Agenten spezifische Dokumente, liefern genaue Plattformvergleiche mit echten Preisen und wissen, wann sie sagen müssen: „Ich habe dazu keine aktuellen Daten.“

Wichtige Erkenntnisse aus der Implementierung:

Klassifiziere vor dem Retrieval — nicht jede Frage benötigt RAG.
Budgetiere dein Kontextfenster — 60.000 Zeichen insgesamt, mit einer festen Obergrenze pro Dokument.
Struktur schlägt Volumen — 200 gut organisierte Artikel sind besser als 10.000 zufällige Textabschnitte.
Selbstheilung ist nicht optional — Wissensdatenbanken zerfallen, daher baue von Tag eins an Monitoring auf.
Schreibe für Agenten, nicht für Menschen — priorisiere Tabellen gegenüber Absätzen, Entscheidungsrahmen gegenüber Prosa und konkrete Beispiele gegenüber abstrakten Erklärungen.

📖 Read the full source: r/openclaw