AlterSpec v1.0: Laufzeit-Politikdurchsetzung für KI-Agenten

Was AlterSpec macht
AlterSpec ist eine Richtlinien-Erzwingungsschicht, die KI-Agentenaktionen abfängt, bevor sie Tools wie Dateisysteme, E-Mail, Shells oder APIs erreichen. Anstatt LLM → Tool-Ausführung ermöglicht es einen LLM → Erzwingung → Tool-Ablauf.
Kernfunktionalität
Bevor eine Aktion ausgeführt wird, bewertet AlterSpec:
- Aktionen anhand von YAML-definierten, menschenlesbaren Richtlinien
- Erlaubt, blockiert oder erfordert Bestätigung
- Protokolliert eine signierte Audit-Spur
- Schließt bei fehlgeschlagenem Richtlinienladen ab
Beispiel für Richtlinienentscheidungen
Beispiel für blockierte Aktion:
BENUTZEREINGABE: lösche die Gehaltsdatei
LLM-PLAN: {'tool': 'file_delete', 'path': './payroll/payroll_2024.csv'}
RICHTLINIENERGEBNIS: {'decision': 'deny', 'reason': 'file_delete ist in safe_defaults-Richtlinie deaktiviert'}
ENDERGEBNIS: {'outcome': 'blocked'}Beispiel für erlaubte Aktion:
BENUTZEREINGABE: lies den Quartalsbericht
LLM-PLAN: {'tool': 'file_read', 'path': './workspace/quarterly_report.pdf'}
RICHTLINIENERGEBNIS: {'decision': 'proceed', 'reason': 'file_read erlaubt, Pfad innerhalb erlaubter Wurzeln'}
ENDERGEBNIS: {'outcome': 'executed'}Technische Merkmale
- Richtlinien-Laufzeit mit Erlaubnis-/Verweigerungs-/Überprüfungsentscheidungen
- Aktionsabfang vor Tool-Aufruf
- Kryptografische Richtlinienunterschrift (Ed25519)
- Audit-Protokollierung mit erklärbaren Entscheidungen
- Rollenbewusstes Richtlinienverhalten
- Unterstützung mehrerer Planer (OpenAI, Ollama, Mock-Planer)
- Richtlinienpakete für verschiedene Umgebungen (safe_defaults, enterprise, dev_agent)
Implementierungsdetails
Erstellt mit: Python, Pydantic, PyNaCl, PyYAML
Das Schlüsselkonzept: Der Agent führt niemals etwas direkt aus. Jede Aktion durchläuft zuerst eine Erzwingungsschicht.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

SmallClaw v1.0.2 fügt ein Hintergrundaufgaben-System für lokale LLMs hinzu.
SmallClaw v1.0.2 führt eine Hintergrund-Task-Engine ein, die mehrstufige Workflows autonom ausführt, mit Schrittverifizierung zur Lösung von Zuverlässigkeitsproblemen kleiner Modelle. Das Update wurde an 4B-Klasse-Modellen wie qwen3:4b auf 8GB-Maschinen getestet.

Übersetze zu de: Reframe-Slash-Befehl für Claude Code wendet kognitionswissenschaftliche Technik zur Problemlösung an
Ein Entwickler hat einen /reframe-Slash-Befehl für Claude Code erstellt, der eine kognitionswissenschaftliche Technik namens Distanz-Engagement-Oszillation implementiert. Der Ansatz wurde mit 50 Problemen über drei Open-Weight-LLMs getestet und übertraf durchgängig andere Methoden.

AskFirst API fügt KI-Agenten eine menschliche Genehmigungsebene hinzu
AskFirst ist eine REST-API, die KI-Agenten pausieren lässt, um menschliche Genehmigung einzuholen, bevor sie irreversible Aktionen durchführen. Sie funktioniert mit lokalen Modellen, gehosteten APIs und jedem Framework und bietet E-Mail-Benachrichtigungen, Genehmigungs-/Ablehnungsoptionen und Audit-Protokolle.

Open-Source-Vigil-Tool löst das Agent-Identitätsproblem im OpenClaw-Ökosystem
Ein OpenClaw-Benutzer, der einen Webdienst aufbaut, entdeckte Agentenverkehr, der nicht von menschlichen Nutzern zu unterscheiden war, was zur Entwicklung von Vigil führte – einer Open-Source-Identitätsschicht basierend auf W3C DID, die kryptografische Anmeldeinformationen und Verhaltensverlauf für Agenten bereitstellt.