Eine 4-stufige Wissensdatenbank-Architektur zur Verbesserung der Genauigkeit von KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 20. März 2026🔗 Source
Eine 4-stufige Wissensdatenbank-Architektur zur Verbesserung der Genauigkeit von KI-Agenten
Ad

Ein Entwickler auf r/openclaw beschrieb eine Architektur für eine strukturierte Wissensdatenbank, die generische LLM-Agenten durch die Bereitstellung spezifischen Kontexts zu Tools, Workflows und Richtlinien zu Domänenexperten machen soll.

Das Problem mit gängigen RAG-Ansätzen

Die Quelle identifiziert mehrere Probleme bei typischen RAG-Implementierungen: keine Abfrageklassifizierung (jede Frage durchläuft dieselbe Retrieval-Pipeline), keine Abstufung (Governance-Dokumente werden wie Blogposts behandelt), kein Budget (Agenten-Kontextfenster wird mit irrelevanten Textabschnitten überladen) und keine Selbstheilung (veraltete/defekte Dokumente bleiben dauerhaft defekt).

Eine 4-stufige KB-Pipeline

Das System verwendet vier verschiedene Stufen:

  • Governance-Stufe — Immer geladen. Enthält Agenten-Identität, Richtlinien und Regeln als nicht verhandelbaren Kontext.
  • Agenten-Stufe — Dokumentation pro Agent. Beispielsweise erhält ein Sprachagent namens Lucy Dokumente zur Anrufbehandlung, während ein Agent namens Binky (CRO) Dokumente zur Konversionsoptimierung erhält.
  • Relevanz-Stufe — Dynamisches Retrieval pro Abfrage mit Titel-/Textabgleich, begrenzt auf maximal 5 Dokumente und ein Budget von 12.000 Zeichen pro Dokument.
  • Wiki-Stufe — Über 200 Referenzartikel, die über eine Dateisystembrücke durchsuchbar sind und KI-Geschichte, Tool-Definitionen, Workflow-Muster und Plattformvergleiche abdecken.

Abfrageklassifizierung als Geheimwaffe

Vor jedem Retrieval bestimmt ein regex-basierter Klassifizierer, wie viel Kontext eine Frage benötigt:

  • DIRECT — Für Aufgaben wie „Fasse diesen Text zusammen“, bei denen keine Wissensdatenbank benötigt wird.
  • SKILL_ONLY — Für Aufgaben wie „Schreibe mir einen Tweet“, bei denen die Skill-Dokumentation des Agenten ausreicht.
  • HOT_CACHE — Für Fragen wie „Wer bearbeitet die Abrechnung?“, die aus Governance- und Agenten-Dokumenten im Speicher-Cache beantwortet werden.
  • FULL_RAG — Für komplexe Abfragen wie „Vergleiche n8n vs. Zapier Preise“, die eine vollständige Vektorsuche und Wiki-Brücke erfordern.

Diese Klassifizierung allein soll die Token-Kosten um etwa 40 % gesenkt haben, da die meisten Fragen kein vollständiges RAG benötigen.

Ad

KB-Struktur und Organisation

Jeder der über 200 Artikel folgt einem einheitlichen Format: ein klarer Titel mit Umfang, praktischer Inhalt (Tabellen, Codebeispiele, Entscheidungsrahmen), 2+ zitierte Quellen mit echten URLs, 5 Bildreferenzbeschreibungen und 2 Videoreferenzen.

Der Inhalt ist in spezifische Domänen organisiert:

  • KI/ML-Grundlagen (18 Artikel) — Geschichte, Transformer, Embeddings, Agenten
  • Tooling (16 Artikel) — Definitionen, Sicherheit, Taxonomie, Fehlerbehandlung, Audit
  • Workflows (18 Artikel) — Typen, Plattformen, Kostenanalyse, HIL-Muster
  • Bildgenerierung (115 Dateien) — 16 Anbieter, Vergleiche, Prompt-Frameworks
  • Videogenerierung (109 Dateien) — Behandlungen, Pipelines, Plattformleitfäden
  • Support (60 Artikel) — Kundenhilfezentrum-Inhalte

Selbstheilendes System

Die Architektur umfasst ein Bewertungssystem, das die KB-Gesundheit auf einer Skala von 0–100 bewertet und Probleme automatisch behebt: Fehlende Embeddings lösen Neu-Embedding aus, veraltete Inhalte werden zur Aktualisierung markiert, und defekte Referenzen werden repariert oder entfernt. Der Gesundheitswert soll sich nach dem ersten Heilungsdurchlauf von 71 auf 89 verbessert haben.

Ergebnisse und wichtige Erkenntnisse

Vor der KB-Implementierung halluzinierten Agenten Tool-Definitionen, erfanden Preise und gaben generische Workflow-Ratschläge. Nach der Implementierung zitieren Agenten spezifische Dokumente, liefern genaue Plattformvergleiche mit echten Preisen und wissen, wann sie sagen müssen: „Ich habe dazu keine aktuellen Daten.“

Wichtige Erkenntnisse aus der Implementierung:

  • Klassifiziere vor dem Retrieval — nicht jede Frage benötigt RAG.
  • Budgetiere dein Kontextfenster — 60.000 Zeichen insgesamt, mit einer festen Obergrenze pro Dokument.
  • Struktur schlägt Volumen — 200 gut organisierte Artikel sind besser als 10.000 zufällige Textabschnitte.
  • Selbstheilung ist nicht optional — Wissensdatenbanken zerfallen, daher baue von Tag eins an Monitoring auf.
  • Schreibe für Agenten, nicht für Menschen — priorisiere Tabellen gegenüber Absätzen, Entscheidungsrahmen gegenüber Prosa und konkrete Beispiele gegenüber abstrakten Erklärungen.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

AgentMarket: Eine Proof-of-Concept-Plattform für KI-Agenten-Ökonomien
Werkzeuge

AgentMarket: Eine Proof-of-Concept-Plattform für KI-Agenten-Ökonomien

AgentMarket.space ist eine Proof-of-Concept-Plattform, auf der KI-Agenten ihre Fähigkeiten registrieren, Aufgaben mit Kreditbudgets veröffentlichen und sich gegenseitig autonom mit einer 90/10-Kreditaufteilung und Groq llama-3.3-70b für das Matching einstellen.

OpenClawRadar
CLAUDE.md: Drop-in-Datei reduziert Claude-Ausgabetokens um 63%
Werkzeuge

CLAUDE.md: Drop-in-Datei reduziert Claude-Ausgabetokens um 63%

CLAUDE.md ist eine einzelne Datei, die die Ausführlichkeit der Claude-Ausgaben um etwa 63 % reduziert, ohne Codeänderungen. Sie zielt auf Schmeichelei, Weitschweifigkeit und Formatierungsrauschen in Claudes Antworten ab.

OpenClawRadar
Clawdex: Ein Verzeichnis zur Verfolgung von OpenClaw-Ableitungen und Forks
Werkzeuge

Clawdex: Ein Verzeichnis zur Verfolgung von OpenClaw-Ableitungen und Forks

Clawdex ist ein Verzeichnis, das 18 OpenClaw-bezogene Projekte in drei Stufen auflistet, mit Daten zu Sternen, Programmiersprache und Kategorie-Tags. Das Projekt ist PR-gesteuert, was bedeutet, dass Mitwirkende das Repo forken, eine YAML-Datei in /src/data/projects/ hinzufügen und einen Pull-Request öffnen müssen.

OpenClawRadar
Karpathys Autoresearch-Projekt: KI-Agenten führen über Nacht LLM-Trainingsexperimente durch
Werkzeuge

Karpathys Autoresearch-Projekt: KI-Agenten führen über Nacht LLM-Trainingsexperimente durch

Andrej Karpathy veröffentlichte ein minimales Autoresearch-Projekt, bei dem ein KI-Agent train.py bearbeitet, 5-minütige Nanochat-Trainingsexperimente durchführt, prüft, ob sich val_bpb verbessert hat, und dies über Nacht auf einer einzelnen GPU wiederholt.

OpenClawRadar