AI生成コードの量がベテランエンジニアを圧倒していると調査が示す

AI支援開発の認知ボトルネック
2025年にNeuron誌で発表された研究によると、人間の脳は意識的・分析的な思考を約10ビット/秒で処理する。ワーキングメモリは一度に約4つの情報チャンクを保持する。この生物学的制限は、AI生成コードの出力との根本的なミスマッチを生み出す。
作業負荷増加の定量化
GitHubのOctoverse 2025によると、月間4,320万件のプルリクエストがマージされ、前年比23%増加。開発者あたりのコード行数は8ヶ月で4,450行から7,839行へ76%増加。Faros AIが10,000人以上の開発者を分析した結果、AIユーザーはAI支援により98%多くプルリクエストをマージしていることが判明。
SmartBear/Ciscoの研究では、100行未満のPRでは欠陥検出率が87%であるのに対し、1,000行を超えるPRでは28%に低下することが確認された。品質は60分のレビュー後に急落。あるOCamlメンテナーは、帯域幅の制約から13,000行のAI生成PRを完全に拒否した。
バーンアウトと作業負荷の浸透
Upwork Research Instituteの調査では、AIを使用する従業員の77%が「AIによって作業負荷が軽減されたのではなく、増加した」と回答。71%がバーンアウトを報告。最も懸念すべき発見は、「最も生産的な」AIユーザーの88%がバーンアウトしており、離職する可能性が2倍高いことだ。
カリフォルニア大学バークレー校の研究者は、「作業負荷の浸透」の3つのメカニズムを特定:タスク拡張(AIによってより多くのことが可能になるため、全員の範囲が膨張)、境界の曖昧化(AIへの指示が昼食時、通勤中、夜間に行われる)、暗黙の圧力(同僚がAIでより多くをこなす姿を見ると、全員への期待が高まる)。
専門性が問題を悪化させる理由
マイクロソフトリサーチは2024年に、AIシステムが困難なタスクをさらに難しくし、ユーザーに同等または増加した認知負荷を残すことを確認。そのメカニズムは非対称的:コードを書く際、開発者は既存のメンタルモデルを外在化するが、AI生成コードをレビューする際には、ビジネス文脈を理解しないシステムによって生成された成果物から推論を逆工程しなければならない。
Clutchが800人のソフトウェア専門家を対象に行った調査では、開発者の59%が完全には理解していないAI生成コードを使用していることが判明。シニアエンジニアはこの環境で最も自信が低いと報告している。
📖 Read the full source: HN AI Agents
👀 See Also

SDLプロジェクト、GitHubの問題を受けてAI生成のコミットを禁止
SDLプロジェクトは、GitHubのイシューでCopilotの使用に関する懸念が提起されたことを受け、AI生成コミットを禁止するポリシーを実施しました。このイシューでは、レビュー #13277 と #12730 をAI支援が検出された例として具体的に言及しています。

Anthropic、Claude AIエージェントに関連するコード流出に対応
Anthropicは、Claude AIエージェントに関連するコードの流出に対処していると、Hacker Newsで13ポイントと6コメントを集めたWSJの記事が報じています。

RTX 4090におけるQwen3.5モデルの2Kから400Kコンテキストのベンチマーク結果
開発者がRTX 4090で複数のQwen3.5モデルバリアントをテストし、2,048から400,000トークンまでのコンテキストウィンドウで性能を測定しました。ベンチマークには初回トークンまでの時間指標が含まれ、一部モデルでKVオフロードテストが必要な問題が明らかになりました。

OpenClaw v3.22のアップデートによりダッシュボードとWhatsAppに問題が発生
OpenClaw v3.22ではダッシュボード機能とWhatsApp連携が破損しており、GitHubのIssue(#52808と#52813)で問題が記録されています。ユーザーはこのバージョンへのアップデートを控えるよう推奨されています。