Zwei neue Open-Source-Tools für KI-Agenten-Sicherheit und -Optimierung

Die r/openclaw-Community hat zwei Open-Source-Tools für KI-Agenten-Entwickler geteilt: AI Agent Defense Kit (veröffentlicht) und AgentGuard (in Entwicklung).
AI Agent Defense Kit
Dies ist ein kostenloses Sicherheits-Toolkit mit Laufzeitschutzfähigkeiten für KI-Agenten. Verfügbare Fähigkeiten umfassen:
skill-auditor- Überprüft Fähigkeiten vor der Installation auf Sicherheitsrisikenurl-preflight- Prüft URLs, bevor Ihr Agent sie abruftcontent-scanner- Scannt Inhalte auf versteckte Anweisungensocial-engineering-detector- Erkennt Manipulationstaktiken in Nachrichtendependency-checker- Überprüft Pakete auf Supply-Chain-Angriffe
Das Repository ist verfügbar unter: https://github.com/moebius-ansa/ai-agent-defense-kit
AgentGuard
Dieses Toolkit (in Entwicklung) befasst sich mit drei häufigen Problemen: unvorhersehbaren Kosten durch autonome KI-Systeme, die Tokens verbrauchen, fehlenden Audit-Protokollen, die zeigen, was Agenten tun, und eingehenden Sicherheitsbedrohungen, bevor Inhalte die Agenten erreichen.
Geplante Startfunktionen umfassen:
- Kostenschätzer - Berechnet automatisch monatliche Kosten nach Modell + Nutzungsgrad
- Modellvergleich - Vergleicht 20+ Modelle verschiedener Anbieter mit Qualitätsbewertungen; verspricht 90%+ Einsparungen bei gleicher Qualität
- Sicherheitsscanner - Erkennt Prompt-Injection, Jailbreaks, System-Prompt-Lecks und andere Angriffe, bevor sie Ihren Agenten erreichen
- Aktivitätsmonitor - Verfolgt Dateiänderungen, API-Aufrufe, Prozessaktivitäten
- Budget- und Aktivitätsalarme - Erhalten Sie Benachrichtigungen auf Discord, Slack, Telegram usw. bei ungewöhnlicher Aktivität oder großen Kostenspitzen
Die Installation erfolgt über: pip install agentguard
Das Tool wird eine intuitive TUI-Oberfläche und einen Agentenmodus bieten, der es Ihrem Agenten ermöglicht, die Plattform für Sie zu bedienen.
Diese Tools behandeln praktische Anliegen von Entwicklern, die KI-Agenten betreiben, insbesondere im Bereich Sicherheitsüberwachung und Kostenmanagement.
📖 Read the full source: r/openclaw
👀 Siehe auch

ClankerRank: Ein Benchmark für KI-gestützte Programmierfähigkeiten mit Claude Haiku
Ein Entwickler hat ClankerRank erstellt, um die Kompetenz beim KI-gestützten Programmieren mithilfe von Claudes Haiku 4.5-Modell zu messen. Die Plattform stellt Nutzern identische Fehler vor, bewertet die Ausgaben mit verborgenen Testsuites und hat klare Kompetenzlücken unter Hunderten von Teilnehmern aufgezeigt.

LLM Circuit Finder: Verdreifachen Sie Schichten, um das Denkvermögen ohne Training zu steigern
Ein neues Toolkit findet 'Reasoning Circuits' in Transformer-Modellen – zusammenhängende Blöcke von 3-4 Schichten, die als unteilbare kognitive Einheiten fungieren. Das Duplizieren dieser Blöcke (Schichten 12-14 in Devstral-24B) verbessert die logische Deduktion von 0,22 auf 0,76 in BBH-Benchmarks, ohne Gewichtsänderungen oder Training.

Vergleich von Multi-Agenten-KI-Systemen: Anthropics Harness vs. Agyns Engineering Org Model
Anthropic veröffentlichte ein Harness-Design für die Entwicklung lang laufender Anwendungen, während Agyns Multi-Agenten-System für team-basierte autonome Softwareentwicklung letzten Monat als Open Source veröffentlicht wurde. Beide Systeme lehnen monolithische Agenten ab und setzen stattdessen auf Rollentrennung, strukturierte Übergaben und Review-Schleifen.

AgentSwarms: Kostenloser praxisorientierter Spielplatz zum Erlernen von Agentischer KI
AgentSwarms bietet 5 Tracks, über 40 Lektionen und 30+ ausführbare Agenten kostenlos – keine Einrichtung oder API-Schlüssel erforderlich, um loszulegen. Lerne durch das Erstellen von Prompts bis hin zu Multi-Agenten-Swarms.