マーリンリサーチが構造化推論のためのQwen3.5-4B-Safety-Thinkingモデルをリリース

マーリンリサーチは、Qwen3.5を基盤とした40億パラメータの安全性に配慮した推論モデル「Qwen3.5-4B-Safety-Thinking」をリリースしました。このモデルは、特にエージェントシステムに焦点を当て、実世界のシナリオにおける構造化された「思考」と安全性のアプリケーションのために特別に設計されています。
主な改善点と特徴
- プロンプト内の厳格な指示を正確に従う能力の向上
- AnthropicのBloomおよびPetri手法の使用に基づく
- ハッキング試行に対する耐性
- 「異常」なプロンプトや敵対的プロンプトに対する耐性の向上
- 最大100万トークンのコンテキストウィンドウ
- Anthropicのフレームワーク - BloomおよびPetriを使用
このモデルは、Hugging FaceのMerlinSafety/Qwen3.5-4B-Safety-Thinkingで利用可能です。
AIエージェントを扱う開発者にとって、このモデルは、構造化された推論とプロンプト操作への耐性が優先される安全性が重要なアプリケーションのための専門的なツールを表しています。AnthropicのBloomおよびPetri手法の統合は、アラインメントに対する憲法AIアプローチへの焦点を示唆しています。
📖 Read the full source: r/LocalLLaMA
👀 See Also

Qwen3.6 27B FP8、RTX 5000 PRO 48GB上で200kトークンBF16 KVキャッシュを80 TPSで実行
Redditユーザーが、Qwen3.6 27B FP8をBF16 KVキャッシュ200kトークンで使用し、1枚のRTX 5000 PRO 48GB上で60~90 TPSを達成するvLLMセットアップを共有。完全な環境変数、設定、ベンチマーク結果を提供。

Claude Coworkは、スラッシュコマンドとスキルを単一の概念の下に統合します。
Claude Coworkは、スラッシュコマンドとスキルを「スキル」という単一の概念に統合し、/メニューの別々の見出しを廃止しました。従来のコマンドは引き続き以前と同様に機能します。

Autonomaの18か月にわたるコードベース書き換え:テスト、技術的負債、サーバーアクションに関する教訓
Autonomaは、エンジニアを2人から14人に拡大した後、1.5年分のコードを破棄しました。その理由として、テストの欠如、厳格でないTypeScriptの使用、およびServer Actionsの制限を挙げ、これらが書き直しの主な要因であると説明しています。

プロバイダーを超えたAPI監視をonWatchで革新する
強力な新ツール「onWatch」が、複数のプロバイダーにわたるAI APIクォータ使用量の追跡を効率化し、制限内での運用とリソース配分の最適化を実現する方法をご紹介します。