함수 호출 하네스 2: 스키마 강제로 CoT 준수율 100% 달성

Qwen Meetup Korea(5월 말)에서 발표된 강연은 함수 호출 하네스 패턴의 두 번째 버전을 소개합니다. 원래 하네스는 유형 검증과 컴파일러 피드백을 사용하여 백엔드 코드 생성에서 qwen3-coder-next의 성능을 6.75%에서 100%로 끌어올렸습니다. 이번 업데이트는 컴파일러가 없는 도메인(투자 메모, 법률 의견, 임상 차트)에 동일한 아이디어를 확장합니다.

스키마 기반 CoT 준수

핵심 메커니즘은 모델의 추론을 필수 형식으로 강제하는 TypeScript 스키마(typia 태그 사용)입니다. 모든 필드를 채워야 하며, 그렇지 않으면 제출이 거부됩니다. 투자 메모의 예시 스키마는 다음과 같습니다:

import { tags } from "typia";

export interface IInvestmentMemo {
  recommendation: "BUY" | "HOLD" | "SELL";
  thesis: {
    consensusView: string;
    differentiatedView: string;
  };
  counterThesis: {
    bearCase: string;
    ourResponse: string;
  };
  // bull / base / bear 모두 필수 — 기본 케이스만 제출하는 것을 차단
  scenarios: {
    bull: IScenario;
    base: IScenario;
    bear: IScenario;
  };
  // 빈 배열은 허용되지 않음
  valuationDrivers: IValuationDriver[] & tags.MinItems<1>;
  killConditions: IKillCondition[] & tags.MinItems<1>;
  evidenceSources: IEvidenceSource[] & tags.MinItems<1>;
}
// 반증 가능한 임계값만 허용 — "경영진에 대한 신뢰"와 같은 자유 형식 차단
export type IKillCondition =
  | { type: "price_drawdown"; percentBelowEntry: number }
  | { type: "metric_breach"; metric: string; below: number }
  | { type: "milestone_miss"; expectedBy: string; what: string };

그런 다음 스키마를 과거 투자 사례에 적용하여 검증합니다. 이는 시장 데이터에 트레이딩 전략을 백테스트하는 것과 동일한 개념입니다. diff는 스키마가 과거 결정 중 올바르게 예측한 것과 놓친 것을 보여주며, 누락된 부분을 추가합니다.