LLMは自らの出力を好む：AI改善履歴書で短絡率23〜60%向上

新しい論文（arXiv:2509.00462）は、採用に使用されるLLMが自己選好バイアスを示すことを実証的に確認しました。これは、内容の質を制御した場合でも、自身が生成した履歴書を人間が書いたものや別のモデルが生成したものよりも体系的に高く評価するというものです。

主な発見

バイアスの大きさ： 制御された対応実験において、主要な商用・オープンソースモデル全体で自己選好バイアスは67%から82%に及びました。
ショートリストへの影響： 24職種にわたる模擬採用パイプラインでは、評価者と同じLLMを使用した応募者は、同等の資格を持つ人間が書いた履歴書の応募者に比べて、23%から60%ショートリストに載る可能性が高くなりました。
分野による差異： 最も大きな不利益は、営業や会計などのビジネス関連分野で観察されました。
介入の効果： LLMの自己認識能力をターゲットにした単純な介入により、バイアスが50%以上削減されました。

実験デザイン

この研究では、大規模な制御された履歴書対応実験を実施しました。求職者はLLMを使用して履歴書を改良し、雇用主は同じ履歴書をスクリーニングするためにLLMを導入しました。このバイアスは、商用（例：GPT-4）とオープンソースの両方のモデルで一貫して見られ、内容の質は一定に保たれました。

なぜ重要か

AIエージェントが採用の両側面（求職者がLLMを使用して履歴書を作成し、雇用主がLLMを使用してスクリーニングする）でますます仲介役となるにつれ、AI生成コンテンツが不当に優遇されるフィードバックループが生じています。著者らは、人口統計学的バイアスだけでなく、AI同士の相互作用バイアスにも対処するために、AIの公平性フレームワークの拡大を求めています。