RedditユーザーがHermes AIエージェントの自己学習機能をテスト、重大な欠陥を発見

✍️ OpenClawRadar📅 公開日: April 16, 2026🔗 Source
RedditユーザーがHermes AIエージェントの自己学習機能をテスト、重大な欠陥を発見
Ad

Hermes vs OpenClaw: 実用的な比較

1月29日ビルド以降OpenClawを使用しているRedditユーザーが、Hermes AIエージェントをテストし、その自己学習能力を評価しました。ユーザーはOpenClawを使用して収入を得ており、それを主要ツールと考えています。

Hermesが実際に行うこと

HermesはOpenClawとの核心的な差別化要素として「自己学習」を宣伝していますが、ユーザーのテストによると:

  • Hermesは機械学習の意味での「自己学習」ではない
  • OpenClawと同様に、マークダウンファイルをメモリとして使用する
  • 「自己学習」とは、手動で記述せずに自動的にスキルを作成することを指す
  • スキル = 自動生成されるマークダウンファイル

重大な問題: 自己評価ループ

ユーザーはHermesの実装における主要な問題を特定しました:

  • Hermesは自身の結果を評価する閉じた学習ループで動作する
  • 実際のパフォーマンスに関わらず、常に良い仕事をしたと考えている
  • インディアナDNRサイトから水質試験結果を取得するテストでは、Hermesは「すべてを混乱させた」が、それでも「素晴らしい成果を上げた」と考えていた
  • ユーザーがエラーを修正するためにスキルを手動編集すると、Hermesの自己改善機能がそれらの編集を上書きする

安定性の主張への疑問

ユーザーは2つのツール間の安定性比較について述べています:

  • Hermesは合計6回のリリースしかない
  • OpenClawは82回のリリースがある
  • Hermesのリリースのうち3回は「動作すらしなかった」
  • 限られたリリース履歴のために、Hermesがより安定しているという主張には注意が必要だとユーザーは助言している

現状と将来

Redditユーザーは、Hermesは現在「OpenClawの使い方を知っている人には使用できない」と結論付けています。しかし、このプロジェクトが「素晴らしいものになる可能性」を認め、その開発を引き続き注視する計画です。

📖 Read the full source: r/openclaw

Ad

👀 See Also

オープンソースのNext.jsスターターキットにAIの低品質出力を防ぐガードレールとエージェント指示を追加
Tools

オープンソースのNext.jsスターターキットにAIの低品質出力を防ぐガードレールとエージェント指示を追加

新しいNext.jsボイラープレートには、認証、データベース、CI、テスト、Claude Codeの指示が最初から含まれており、AIコーディングエージェントを使用してプロダクションアプリをより速く構築したい開発者を対象としています。

OpenClawRadar
Ssemble MCPサーバーは、ClaudeがYouTubeからショート動画を生成できるようにします
Tools

Ssemble MCPサーバーは、ClaudeがYouTubeからショート動画を生成できるようにします

Ssemble AI Clipping用の新しいMCPサーバーにより、ClaudeはYouTubeのURLからAI生成クリップ、キャプションテンプレート、音楽トラック、オーバーレイを使用してTikTok/Reels/Shortsスタイルの動画を作成できるようになりました。セットアップには、Claude Desktopへの設定追加またはホストされたエンドポイントの使用が含まれます。

OpenClawRadar
ClearSpec: Claudeコードにおけるハルシネーションを軽減する仕様ジェネレーター
Tools

ClearSpec: Claudeコードにおけるハルシネーションを軽減する仕様ジェネレーター

ClearSpecは、平易な英語の説明から構造化された仕様書を生成するツールで、GitHubリポジトリに接続して実際のファイルパスや依存関係を参照し、その仕様書をClaude Codeへのプロンプトとして使用して、より良いコンテキストを提供します。

OpenClawRadar
スチールマン R5: 微調整された14BモデルがAdaコード生成でClaude Opusを上回る
Tools

スチールマン R5: 微調整された14BモデルがAdaコード生成でClaude Opusを上回る

開発者は、3,430のAda/SPARK命令ペアからなるコンパイラ検証済みデータセットを使用してQLoRAでQwen2.5-Coder-14B-Instructをファインチューニングし、カスタムベンチマークで68.6%のコンパイル率を達成しました。これはClaude Opus 4.6の42.1%を上回る結果です。このモデルはOllama経由で利用可能で、12GBのVRAMに収まります。

OpenClawRadar