Qwen Meetup 草案: 関数呼び出しハーネス2、構造化スキーマによりCoT準拠率を9.91%から100%に向上

✍️ OpenClawRadar📅 公開日: May 2, 2026🔗 Source
Qwen Meetup 草案: 関数呼び出しハーネス2、構造化スキーマによりCoT準拠率を9.91%から100%に向上
Ad

Qwen Meetup Korea(5月末)での講演では、関数呼び出しハーネスパターンの第2版が紹介されました。オリジナルのハーネスは、型検証とコンパイラフィードバックを使用して、qwen3-coder-nextのバックエンドコード生成を6.75%から100%に引き上げました。このアップデートは、コンパイラがない領域(投資メモ、法的意見、臨床チャート)にも同じアイデアを拡張します。

スキーマ駆動型CoT準拠

核心となるメカニズムは、typiaタグを使用したTypeScriptスキーマで、モデルの推論を必須形式に強制します。すべてのフィールドが入力されないと、提出は拒否されます。投資メモのスキーマ例:

import { tags } from "typia";

export interface IInvestmentMemo { recommendation: "BUY" | "HOLD" | "SELL"; thesis: { consensusView: string; differentiatedView: string; }; counterThesis: { bearCase: string; ourResponse: string; }; // bull / base / bear はすべて必須 — 基本ケースのみの提出を防止 scenarios: { bull: IScenario; base: IScenario; bear: IScenario; }; // 空配列は封印 valuationDrivers: IValuationDriver[] & tags.MinItems<1>; killConditions: IKillCondition[] & tags.MinItems<1>; evidenceSources: IEvidenceSource[] & tags.MinItems<1>; }

// 反証可能な閾値のみ — 「経営陣への信頼」のような自由形式を防止 export type IKillCondition = | { type: "price_drawdown"; percentBelowEntry: number } | { type: "metric_breach"; metric: string; below: number } | { type: "milestone_miss"; expectedBy: string; what: string };

そして、スキーマは過去の投資事例に適用して検証されます — これはトレーディング戦略を市場データでバックテストするのと同じ考え方です。差分は、スキーマが過去の判断のうちどれを正しく捉え、どれを見逃したかを示します。不足している部分を追加します。

Ad

測定されたCoT準拠

AutoBEのCoT機能(金融投資分析自体ではありません)を使用して、qwen3.6-27bは、これらのCoT準拠スキーマにおいて最先端モデルに匹敵します。ハーネスにより、準拠率が9.91%から100%に向上します。

対象読者

自動的な正確性チェックがない領域(例:金融、法律、医療)で、構造化され検証可能な推論を必要とするAIエージェントを開発する方。

📖 全文を読む: r/LocalLLaMA

前回の発表: パート1

Ad

👀 See Also

WebアプリにOpenClawエージェントをデプロイするスキルの構築方法 - 舞台裏の解説
Tools

WebアプリにOpenClawエージェントをデプロイするスキルの構築方法 - 舞台裏の解説

OpenClawエージェント向けに開発された革新的な新スキルについてご紹介します。このスキルはWebアプリへの簡単なデプロイを可能にします。その特徴、利点、そして生産プロセスをどのように変革するかについて学びましょう。

OpenClawRadar
🦀
Tools

外科的GitHub抽出:1つの関数だけを取得するClaudeスキル

新しいオープンソースのClaude Skill「surgical-github-extraction」は、関数やパターンだけを取得したいときに、Claude Codeがリポジトリ全体をクローンするのを防ぎます。READMEを読み、生のソースファイルを1〜3つ取得し、最小限の有用なユニットを出典コメント付きで抽出します。

OpenClawRadar
Grape Root Toolは、リポジトリコンテキストをキャッシュすることでClaudeコードのトークン使用量を削減します
Tools

Grape Root Toolは、リポジトリコンテキストをキャッシュすることでClaudeコードのトークン使用量を削減します

Grape Rootという無料の実験的ツールは、Claude Codeにおける冗長なトークン消費に対処します。以前に探索されたリポジトリファイルに関する軽量な状態を維持することで、フォローアッププロンプト時の変更されていないファイルの不要な再読み込みを防ぎます。

OpenClawRadar
ワンコマンドCLIでVPSにOpenClawをデプロイ
Tools

ワンコマンドCLIでVPSにOpenClawをデプロイ

Redditユーザーが、$4.99/月のVPSにOpenClawをワンコマンドでデプロイするCLIを開発したと主張しており、Mac Miniの使用に比べてコスト効率の良い代替手段を提供しています。

OpenClawRadar