ジェミニ 3.1 フラッシュ ライブ:ベンチマークと透かし機能を強化したGoogleの最新音声モデル

✍️ OpenClawRadar📅 公開日: March 26, 2026🔗 Source
ジェミニ 3.1 フラッシュ ライブ:ベンチマークと透かし機能を強化したGoogleの最新音声モデル
Ad

Gemini 3.1 Flash Liveの新機能

Googleは、リアルタイム対話向けに設計された最高品質のオーディオおよび音声モデルであるGemini 3.1 Flash Liveをリリースしました。このモデルは、音声優先のAIアプリケーション向けに、速度と自然なリズムを向上させています。

主な技術詳細

  • ベンチマークスコア: ComplexFuncBench Audio(制約付き多段階関数呼び出し)で90.8%、Scale AIのAudio MultiChallenge(「思考」機能付き複雑な指示追従)で36.1%
  • 強化された機能: トーンの理解力向上、ピッチやペースなどの音響ニュアンスの認識、ユーザーの苛立ちや混乱への動的調整
  • 透かし技術: 生成されるすべてのオーディオには、AIコンテンツ検出用のSynthID透かしが含まれます
  • 多言語サポート: 200以上の国と地域で利用可能

提供状況とアクセス方法

  • 開発者向け: Google AI StudioのGemini Live APIを介してプレビュー版で利用可能
  • 企業向け: Gemini Enterprise for Customer Experienceに含まれています
  • 一般ユーザー向け: Search LiveおよびGemini Liveからアクセス可能

このモデルは、騒がしい環境での複雑なタスクを処理する音声対応エージェントの構築を可能にし、長時間の対話中に長い会話スレッドをサポートします。

📖 Read the full source: HN AI Agents

Ad

👀 See Also

OpenClaw 2026.4.29 破損 – 2026.2.6 へのダウングレード
News

OpenClaw 2026.4.29 破損 – 2026.2.6 へのダウングレード

OpenClawバージョン2026.4.29は、ランダムエラー、CLIの動作遅延、二重応答などの問題が発生しています。修正するには、バージョン2026.2.6にダウングレードしてください。

OpenClawRadar
AIエージェントには、自律性だけでなくロールバックプリミティブが必要です。
News

AIエージェントには、自律性だけでなくロールバックプリミティブが必要です。

ある開発者は、エージェントフレームワークは部分的な障害に対処するために、ACID、サーガ、補償アクションといったデータベースの概念を採用すべきであり、LLMに「なんとかさせる」ことに頼るべきではないと主張している。

OpenClawRadar
AIモデルは自らのツールとUIについて自己認識を持たない
News

AIモデルは自らのツールとUIについて自己認識を持たない

ChatGPTやClaudeなどのAIモデルは、自らの機能やインターフェースについて、新しいスラッシュコマンドの存在を否定したり古いUIバージョンを説明したりするなど、誤った情報や古い情報を提供することがよくあります。これは、製品が絶えず進化している一方で、モデルは過去のデータスナップショットで学習されているためです。

OpenClawRadar
スタンフォード大学CS25トランスフォーマー講座、一般公開へ ライブ配信も実施
News

スタンフォード大学CS25トランスフォーマー講座、一般公開へ ライブ配信も実施

スタンフォード大学のCS 25 Transformersセミナーが一般公開され、2025年1月23日午後4時30分から5時50分(PDT)に講義が開始されます。Skilling Auditoriumでの対面参加またはZoomでの参加が可能で、録画はオンラインで公開されます。

OpenClawRadar