Die Notwendigkeit relationaler Governance in Multi-Agenten-Systemen

Die Governance-Lücke in Multi-Agenten-Systemen
Das Vertrauen in vollständig autonome KI-Agenten für Unternehmensanwendungen sank von 43 % im Jahr 2024 auf 22 % im Jahr 2025, trotz technologischer Verbesserungen. Die Infrastruktur entwickelt sich rasant mit Googles Agent2Agent, Anthropics Model Context Protocol, das zum Industriestandard wird, Visa, das agenteninitiierte Transaktionen verarbeitet, und Singapur, das im Januar 2026 den weltweit ersten dedizierten Governance-Rahmen für agentische KI veröffentlichte.
Aktuelle Governance-Landschaft
Bestehende Rahmenwerke adressieren wichtige Risiken, haben jedoch Einschränkungen:
- Singapurs Modell-KI-Governance-Rahmen für agentische KI konzentriert sich auf vier Dimensionen: Begrenzung der Agentenautonomie und des Aktionsraums, Erhöhung der menschlichen Verantwortlichkeit und Sicherstellung der Nachvollziehbarkeit
- Das Know-Your-Agent-Ökosystem umfasst Visa, Trulioo, Sumsub und Startups, die die Identitätsverifizierung von Agenten lösen
- ISO 42001 bietet ein Managementsystem-Rahmenwerk zur Dokumentation der Aufsicht
- OWASP Top 10 für LLM-Anwendungen identifiziert "Exzessive Agentur" als kritische Schwachstelle
- Das dreistufige Leitplankenmodell umfasst grundlegende Standards, kontextbezogene Kontrollen und ethische Leitplanken
Diese Rahmenwerke regeln Agenten als Individuen mit korrekter Identität, Berechtigungen und Prüfpfaden, adressieren jedoch nicht die Beziehungen zwischen zusammenarbeitenden Agenten.
Forschungsergebnisse zu Agenteninteraktionen
Jüngste Studien zeigen kritische Lücken in aktuellen Ansätzen:
- Salesforces KI-Forschungsteam baute eine "A2A-Semantikschicht" für Agent-zu-Agent-Verhandlungen und stellte fest, dass die Dynamik grundlegend anders ist als bei Mensch-Agent-Gesprächen, wenn zwei Agenten im Namen konkurrierender Interessen verhandeln
- Modelle wurden als hilfreiche Gesprächsassistenten trainiert, nicht um in adversarischen Kontexten zu vertreten, Druck zu widerstehen oder strategische Kompromisse einzugehen
- Agent-zu-Agent-Interaktionen sind keine hochskalierten Versionen von Mensch-Agent-Gesprächen – es sind völlig neue Dynamiken, die maßgeschneiderte Lösungen erfordern
- Ein groß angelegter KI-Verhandlungswettbewerb mit über 180.000 automatisierten Verhandlungen ergab, dass Wärme durchweg Dominanz bei allen wichtigen Leistungskennzahlen übertraf
- Warme Agenten stellten mehr Fragen, drückten mehr Dankbarkeit aus und erreichten mehr Vereinbarungen
- Dominante Agenten beanspruchten mehr Wert in einzelnen Transaktionen, führten aber deutlich häufiger zu Pattsituationen
- Beziehungsaufbau durch Wärme in ersten Begegnungen verstärkt sich im Laufe der Zeit, wenn Agenten auf vergangene Interaktionen verweisen können
- Relationales Gedächtnis und relationaler Stil sind für Ergebnisse relevant, nicht nur Berechtigungen und Prüfpfade
Der aktuelle Governance-Ansatz behandelt Agenten wie Individuen, die ein Gebäude mit verifizierten Anmeldedaten und Zugangskarten betreten, aber Multi-Agenten-Systeme funktionieren eher wie Teams, die Kommunikationsnormen, Mechanismen zur Klärung von Missverständnissen und Vermittlung bei Koordinationsproblemen benötigen.
📖 Read the full source: r/openclaw
👀 Siehe auch

Reddit-Benutzer meldet 18,8 Tok/s CPU-Inferenz mit Qwen 3 30B Q4 auf Zen 4
Ein Nutzer auf r/LocalLLaMA testete Qwen 3 30B Q4 auf CPU und erreichte 18,8 Token pro Sekunde mit einem Zen-4-Prozessor und DDR5-Arbeitsspeicher, was die Erwartungen von 3-5 Tok/s deutlich übertraf.

Claude-Code v2.1.94 fügt Mantle-Unterstützung hinzu und behebt kritische Fehler.
Claude-Code v2.1.94 führt Unterstützung für Amazon Bedrock über Mantle mit der Umgebungsvariable CLAUDE_CODE_USE_MANTLE=1 ein, ändert das Standard-Aufwandniveau für die meisten Benutzer auf hoch und behebt über 15 Fehler, darunter die Behandlung von Ratenbegrenzungen, macOS-Anmeldeprobleme und Probleme mit dem Plugin-System.

Exploring Schritt 3.5 Flash: Open-Source-Modell für schnelles tiefes Denken
Schritt 3.5 Flash ist ein Open-Source-Grundlagenmodell, das für schnelles und effizientes tiefes Denken entwickelt wurde und eine spärliche Mixture of Experts-Architektur nutzt.
Opus 4.7 Reasoning Effort Benchmark: Medium schlägt High und Max bei realen Aufgaben
In 29 Aufgaben aus dem GraphQL-go-tools-Repo erreicht Opus 4.7 in Claude Code bei mittlerem Reasoning-Aufwand die Spitzenleistung – höhere Einstellungen verschlechtern die Korrektheit und erhöhen die Kosten, ohne die Patch-Qualität zu verbessern.