Claude CodeのRead Toolが画像を無言で縮小し、幻覚を引き起こす

Redditユーザーによると、Claude Codeのreadツールは画像をモデルに渡す前に静かに解像度を下げているとのことです。ユーザーが4.7 RetinaスクリーンショットをClaude Code経由でClaude Opus 4.7に送り、そこからテキストを抽出するよう依頼したところ、モデルは「すべての値を完全に読み取れなかった」という曖昧な要約を返しました。そのテキストはユーザーのモニターではフル解像度で明確に読めるものでした。
調査の結果、ユーザーはreadツールがモデルが処理する前に画像の解像度を下げていることを発見しました。モデルが見るのはオリジナルのスクリーンショットではなく、品質が低下したコピーです。このツールはテキストファイルを読む場合と区別がつかない結果を返し、画像がリサンプリングされたことに関する警告は一切ありません。つまり、Claude Codeに依存してスクリーンショットからUIテキスト、エラーメッセージ、その他の画面コンテンツを抽出している開発者は、ぼやけた入力に基づいた自信過剰で不正確な回答を得ている可能性があります。
ユーザーは、これまでのスクリーンショットベースのやり取りの多くが結果として幻覚を引き起こしていた可能性があると懸念を表明しました。この投稿はr/ClaudeAIコミュニティで大きな議論を引き起こしています。
📖 Read the full source: r/ClaudeAI
👀 See Also

harshal-mcp-proxy がnpmに登場:1つのデーモンで12のMCPサーバー設定を置き換え
harshal-mcp-proxyが54kBのnpmパッケージとして利用可能になりました。グローバルインストールしてデーモンとして実行し、12個の個別MCPサーバー設定を6つのツールに置き換え、セッションあたり約2.7GBのRAMと約50Kトークンを節約できます。

Claude Code as a Compiler: AI開発のための実践的な再構築
Redditの投稿によると、Claude Codeはアシスタントではなく、文字通りの意味でのコンパイラとして機能しているとのことです。英語を動作するソフトウェアに翻訳するコンパイラであり、これはグレース・ホッパーのA-0やFORTRANといった歴史的なコンピューティングのブレークスルーに類似しています。著者は、3段落の英語による説明から6ファイルにわたる約400行のコードを生成し、25分で2つの問題点を発見したと述べています。

OpenYak: ローカルファイル管理と自動化のためのオープンソースデスクトップAIエージェント
OpenYakは、完全にユーザーのマシン上で動作するオープンソースのデスクトップAIアシスタントです。ファイル管理、データ分析、オフィス自動化を提供し、OpenRouterと20以上のBYOKプロバイダーを通じて100以上のAIモデルを利用できます。

ステアリング-8B:トークンレベルの帰属付けを備えた解釈可能な言語モデル
Guide Labsは、生成されたトークンを入力コンテキスト、人間が理解可能な概念、およびトレーニングデータソースにトレースできる、1.35兆トークンでトレーニングされた80億パラメータの言語モデル「Steerling-8B」をリリースしました。このモデルは、2〜7倍のデータでトレーニングされたモデルと競争力のあるパフォーマンスを達成しています。