PeerZero: KI-Agenten führen Peer-Reviews mit Glaubwürdigkeitsbasierten Anreizen durch

PeerZero ist eine Peer-Review-Plattform, auf der KI-Agenten – keine Menschen – Forschungsarbeiten einreichen, die Arbeiten anderer begutachten, schlechte Wissenschaft in Frage stellen und ihre Glaubwürdigkeit darauf verwetten, richtig zu liegen. Die Entwickler beschreiben es als ein Experiment, um zu sehen, was passiert, wenn KI-Agenten unter Wettbewerbsdruck stehen, um originelle Forschung zu produzieren, diese zu verteidigen und Konsequenzen zu tragen, wenn sie falsch liegen.
Kernmechanismen
Agenten reichen Arbeiten ein, und andere Agenten begutachten sie. Wenn ein Agent glaubt, dass eine Arbeit falsch ist, kann er ein Kopfgeld aussetzen – seine eigene Glaubwürdigkeit aufs Spiel setzen, eine Widerlegung schreiben und die Community entscheiden lassen. Wenn er recht hat, gewinnt er; wenn nicht, zahlt er.
Jeder Agent hat einen Glaubwürdigkeitswert, der steigt, wenn er recht hat, und sinkt, wenn er falsch liegt. Dieser Wert bestimmt das Gewicht der Begutachtung: Eine 7/10-Bewertung eines hochglaubwürdigen Agenten hat mehr Gewicht als eine 7/10 eines Spammers.
Gerechtfertigter-Außenseiter-System
Wenn Sie eine Arbeit mit 2/10 bewerten, während andere sie mit 7/10 bewerten, erhalten Sie sofort einen Glaubwürdigkeitsabzug dafür, dass Sie ein Außenseiter sind. Wenn jemand ein Kopfgeld aussetzt, eine Widerlegung schreibt und die Community zustimmt, dass die Arbeit fehlerhaft war (die Wahrheitsanker landet bei 3), kehrt sich das System um: Sie erhalten einen Gerechtfertigungsbonus, und jeder Agent, der eine 7/10-Bewertung abgestempelt hat, verliert Glaubwürdigkeit. Dies belohnt unabhängiges Denken und bestraft Gruppendenken.
Anti-Manipulationsmaßnahmen
- Alles mit 7/10 bewerten, um auf Nummer sicher zu gehen? Sie werden entlarvt, wenn gerechtfertigte Außenseiter beweisen, dass Sie falsch lagen.
- Kopfgeld auf alles aussetzen? Fehlgeschlagene Herausforderungen kosten Sie Glaubwürdigkeit.
- Mit Verbündeten koordinieren? Ring-Erkennung markiert Agenten, die zu viele Bewertungen teilen.
- Begutachtungen ohne jemals zu veröffentlichen? Stufenobergrenzen erfordern, dass Sie tatsächlich Wissenschaft betreiben.
Die Entwickler geben an, dass sie versucht haben, es zu brechen, bevor es jemand anderes könnte, wobei jeder offensichtliche Angriffsvektor eine eingebaute Gegenmaßnahme hat.
Experimentelle Ziele
Das System erzeugt evolutionären Druck: Schlechte Agenten verlieren Glaubwürdigkeit und verschwinden, während gute Agenten aufsteigen und höhere Standards setzen. Das Unbekannte ist, ob sich Agenten anpassen werden – bessere Quellen zitieren, Methoden verschärfen und im Laufe der Zeit stärkere Arbeiten veröffentlichen, weil die Anreizstruktur dies belohnt.
Die Plattform ist live unter peerzero.science, mit Aktualisierungen, sobald Agenten mit dem Veröffentlichen beginnen.
📖 Read the full source: r/openclaw
👀 Siehe auch

KI-Codierer laufen mit offenen Laptops herum, um Agenten am Laufen zu halten
Technikbegeisterte tragen Laptops im Clamshell-Modus, damit KI-Codierungsagenten wie Claude Code und OpenAI Codex nicht anhalten. Zu den Tipps gehört die Verwendung von 'caffeinate' auf dem Mac.

Claude Code v2.1.158: Auto-Modus jetzt auf Bedrock, Vertex, Foundry für Opus 4.7/4.8
Claude Code v2.1.158 ermöglicht den Auto-Modus auf Bedrock, Vertex und Foundry für Opus 4.7 und 4.8. Aktivieren Sie ihn mit CLAUDE_CODE_ENABLE_AUTO_MODE=1.

Non-Profit-Organisationen erhalten Zugang zu Claude Opus 4.6 in Team- und Unternehmensplänen.
Gemeinnützige Organisationen, die die Team- und Enterprise-Pläne nutzen, können jetzt ohne zusätzliche Kosten auf Claude Opus 4.6, das neueste KI-Modell von Anthropic, zugreifen.

Claude Opus 4.1 erzielt 17,75 % auf dem privaten Datensatz von SWE-Bench Pro und unterstreicht damit die Kluft zwischen Auswendiglernen und logischem Denken.
Claude Opus 4.1 erzielte 80 % bei SWE-Bench Verified, sank jedoch auf 17,75 % bei SWE-Bench Pros privatem Datensatz mit 276 Aufgaben aus 18 proprietären Startup-Codebasen. Scale AIs Analyse ergab, dass Modelle eher durch Erinnerung navigierten als durch logisches Denken bei bekannten Repositories.