オラマの技術的問題とコミュニティの論争

✍️ OpenClawRadar📅 公開日: April 18, 2026🔗 Source
オラマの技術的問題とコミュニティの論争
Ad

Ollamaのコア技術と帰属表示の問題

Ollamaの推論能力全体は、元々2023年3月にGeorgi Gerganovによって作成されたC++推論エンジンであるllama.cppに由来していました。1年以上にわたり、OllamaのREADMEにはllama.cppへの言及が一切なく、彼らが配布していたバイナリには、同梱していたllama.cppコードに必要なMITライセンスの通知が含まれていませんでした。

コミュニティは2024年初頭にライセンス遵守を求めるGitHub issue #3185を開設しましたが、メンテナからの応答がないまま400日以上が経過しました。2024年4月にllama.cppの承認を具体的に求めるissue #3697が開設された際、Ollamaの共同創設者であるMichael Chiangは最終的にREADMEの末尾に「llama.cppプロジェクトはGeorgi Gerganovによって設立されました」という1行を追加しました。

カスタムバックエンドの技術的問題

2025年半ば、Ollamaは推論バックエンドとしてのllama.cppの使用をやめ、ggml上に直接構築されたカスタム実装に移行しました。このカスタムバックエンドは、llama.cppが数年前に解決していたバグを再導入してしまいました。それには以下のものが含まれます:

  • 構造化出力サポートの不具合
  • ビジョンモデルの失敗
  • 複数バージョンにわたるGGMLアサーションクラッシュ
  • 上流のllama.cppでは正常に動作したモデルがOllamaでは失敗する
  • GPT-OSS 20Bなどの新リリースに必要なテンソルタイプのサポート不足

Georgi Gerganovは、OllamaがGGMLをフォークして不適切な変更を加えたことを指摘しました。

Ad

性能ベンチマーク

複数のコミュニティテストによると、同じハードウェアとモデルでllama.cppはOllamaよりも1.8倍高速に動作しています:

  • 1秒あたり161トークン対89トークン
  • CPUでは性能差は30〜50%
  • 最近のQwen-3 Coder 32Bでの比較では、llama.cppで約70%高いスループットを示した

この性能オーバーヘッドは、Ollamaのデーモン層、不十分なGPUオフローディングのヒューリスティック、および上流に遅れをとるベンダーバックエンドに起因しています。

モデル命名の問題

2025年1月にDeepSeekがR1モデルファミリーをリリースした際、Ollamaはより小さな蒸留版モデル(DeepSeek-R1-Distill-Qwen-32Bなどのモデル)を、それらが完全版モデルではなく蒸留版であることを明確に示さずにリストアップしました。

📖 Read the full source: HN LLM Tools

Ad

👀 See Also

オープンソース 記事12 EU AI法対応ロギングライブラリ
Tools

オープンソース 記事12 EU AI法対応ロギングライブラリ

Vercel AI SDKを使用するNode.jsアプリ向けの無料オープンソースTypeScriptライブラリで、追記専用JSONLログによるEU AI法第12条のロギング要件を実装し、改ざん検出のためのSHA-256ハッシュ連鎖と180日間の保持期間強制を提供します。

OpenClawRadar
自然言語オートエンコーダ:クロードの内部表現をテキストに変換する
Tools

自然言語オートエンコーダ:クロードの内部表現をテキストに変換する

Transformer Circuits Threadが、Claudeの内部活性化を可読テキストにデコードするNatural Language Autoencodersを公開。GitHubリポジトリとインタラクティブデモも利用可能。

OpenClawRadar
Claude Codeによるプログラミング言語構築:カツレツ実験
Tools

Claude Codeによるプログラミング言語構築:カツレツ実験

アンクール・セティは、4週間かけてClaude Codeを使用して「Cutlet」という完全なプログラミング言語を構築しました。AIがすべてのコード行を生成する一方で、彼はガードレールとテストに集中しました。この言語は動的型付け、ベクトル化操作、REPLを特徴とし、macOSとLinuxで動作します。

OpenClawRadar
LLMsは明示的な指示にもかかわらず、構造化された出力に推論を漏洩させる
Tools

LLMsは明示的な指示にもかかわらず、構造化された出力に推論を漏洩させる

Claudeへの並列API呼び出しを行い構造化出力を解析するツールを開発している開発者は、検証モデルが修正されたテキストのみを返すよう明示的に指示されているにもかかわらず、断続的に推論テキストを出力してから修正内容を返す問題に遭遇しました。解決策は、プロンプトの厳格化と、解析前に実行する防御的な除去関数の組み合わせでした。

OpenClawRadar