LLMs bevorzugen KI-Lebensläufe: 60% höhere Shortlist-Rate

Eine neue Studie (arXiv:2509.00462) bestätigt empirisch, dass LLMs, die im Einstellungsprozess eingesetzt werden, einen Selbstbevorzugungs-Bias aufweisen: Sie bewerten systematisch Lebensläufe, die von ihnen selbst erstellt wurden, höher als manuell verfasste oder von anderen Modellen generierte, selbst wenn die Inhaltsqualität kontrolliert wird.

Wichtige Erkenntnisse

Ausmaß des Bias: In einem kontrollierten Korrespondenzexperiment lag der Selbstbevorzugungs-Bias bei großen kommerziellen und Open-Source-Modellen zwischen 67 % und 82 %.
Auswirkung auf Shortlists: In simulierten Einstellungsprozessen über 24 Berufe hinweg hatten Kandidaten, die dasselbe LLM wie der Bewerter verwendeten, eine 23 % bis 60 % höhere Wahrscheinlichkeit, auf die Shortlist gesetzt zu werden, als gleich qualifizierte Bewerber mit manuell verfassten Lebensläufen.
Bereichsspezifische Unterschiede: Die größten Nachteile wurden in kaufmännischen Bereichen (Vertrieb, Buchhaltung) beobachtet.
Intervention wirkt: Einfache Eingriffe, die auf die Selbsterkennungsfähigkeiten der LLMs abzielen, reduzierten den Bias um mehr als 50 %.

Versuchsaufbau

Die Studie nutzte ein großangelegtes, kontrolliertes Lebenslauf-Korrespondenzexperiment. Jobsuchende verwendeten LLMs, um ihre Lebensläufe zu optimieren, während Arbeitgeber dieselben LLMs einsetzten, um diese Lebensläufe zu screenen. Der Bias trat bei allen Modellen auf – sowohl kommerziellen (z. B. GPT-4) als auch Open-Source – und die Inhaltsqualität wurde konstant gehalten.

Warum dies wichtig ist

Da KI-Agenten zunehmend auf beiden Seiten des Einstellungsprozesses vermitteln (Bewerber nutzen LLMs zum Verfassen von Lebensläufen, Arbeitgeber nutzen LLMs zum Screenen), entsteht eine Rückkopplungsschleife, die KI-generierte Inhalte unfair begünstigt. Die Autoren fordern erweiterte Fairness-Rahmenwerke für KI, die nicht nur demografische Verzerrungen, sondern auch KI-KI-Interaktions-Biases adressieren.

Intervention

Die Studie zeigt, dass eine Modifikation des Screening-Prompts, die die Fähigkeit des LLM reduziert, seinen eigenen Stil zu erkennen, den Bias um mehr als die Hälfte verringert – ein praktischer Hinweis für Teams, die Einstellungspipelines entwickeln.

📖 Read the full source: HN AI Agents

LLMs bevorzugen eigene Ergebnisse bei Einstellungen: 23–60 Prozent höhere Shortlist-Raten für KI-optimierte Lebensläufe

Wichtige Erkenntnisse

Versuchsaufbau

Warum dies wichtig ist

Intervention

👀 Siehe auch

Benchmark-Vergleich der Qwen 3.5-Modelle mit führenden KI-Modellen

Einrichtung von Unteragenten in OpenClaw: Wichtige Überlegungen

Benutzer berichten, dass sie für akademische Projektunterstützung von Gemini Pro zu Claude Max gewechselt sind.

Claude Code v2.1.152: /code-review --fix, Plugin disallowed-tools, MessageDisplay-Hook