Kimi K2.7-Code: 더 나은 토큰 효율성을 갖춘 오픈소스 코딩 모델

Moonshot AI가 Kimi K2.7-Code를 출시했습니다. 이는 Hugging Face의 moonshotai/Kimi-K2.7-Code 네임스페이스에서 제공되는 오픈소스 코딩 모델로, image-text-to-text 태그가 붙어 있으며 Transformers 라이브러리를 사용합니다. 코드 생성 및 이해 작업을 위한 토큰 효율적인 대안으로 자리매김하고 있습니다.
주요 특징
- 추론 제공자: Novita는 실시간 상태, 도구 호출 지원(
toolCalling: true)을 제공하며, 구조화된 출력은 현재 사용할 수 없습니다. 처리량은 초당 36.1 토큰으로 측정되었습니다. - 모델 아키텍처: 모델은 64개의 샤드(safetensors 형식:
model-00001-of-000064.safetensors)로 제공됩니다. - 토큰 효율성: 모델은 추론 내용을 보존하는(
preserve_thinking: true) 사용자 정의 채팅 템플릿을 사용하며, 기록과 접미사 메시지를 분리하여 토큰 사용을 최적화합니다. 템플릿에는 역할 관리를 위한 특수 토큰(<|im_user|>,<|im_assistant|>,<|im_system|>)과 사고 사슬 추론을 캡슐화하는<think>/</think>블록이 포함됩니다. - 도구 호출: 구조화된 인수 형식의 도구 호출을 기본 지원하며,
<|tool_call_begin|>및<|tool_call_end|>마커를 사용합니다. - 커뮤니티 참여: 게시 시점 기준 Hugging Face에서 334개의 좋아요, HN 댓글 4개, 포인트 41개를 기록했습니다.
실용적 의미
템플릿 설계는 preserve_thinking이 false일 때 기록에 추론 토큰을 포함하지 않도록 하여 컨텍스트 오버헤드를 줄입니다. AI 코딩 에이전트를 사용하는 개발자에게 이는 상호작용당 더 낮은 토큰 소비를 의미하며, 특히 추론 체인이 반복되는 긴 에이전트 루프에서 유용합니다. 도구 호출 형식은 JSON에 맞춰져 있어 기존 함수 호출 파이프라인에 쉽게 통합할 수 있습니다.
이 모델은 Novita를 통해 즉시 사용 가능하며, Hugging Face 저장소에는 전체 토크나이저 구성과 템플릿 소스가 포함되어 있습니다.
📖 전체 소스 읽기: HN AI Agents
👀 See Also

프론티어 AI 접근 제한 강화: Anthropic의 미토스와 선택적 출시로의 구조적 전환
Anthropic의 Mythos 사이버보안 모델과 OpenAI의 Daybreak 계획은 경제적, 안보적 제약으로 인해 특정 미국 기반 기업만이 최첨단 AI에 접근할 수 있는 새로운 시대를 예고하며, 이는 오용 위험, 증류 위협, 그리고 새로운 정부 규제에 의해 주도됩니다.

클로드의 음성 인식 한계와 사용자들의 Spokenly 및 Parakeet TDT를 활용한 해결 방법
사용자가 Claude의 내장 마이크 음성 인식이 ChatGPT에 비해 부정확하다고 보고하며, 이로 인해 절약되는 노력보다 더 많은 작업이 발생한다고 말합니다. 그들은 Mac에서 Spokenly와 NVIDIA의 Parakeet TDT 모델을 사용하여 성능을 개선하는 임시 해결책을 구현했습니다.

애틀랜타에서 감시 임무를 위해 AI 기반 로봇 개 배치
카메라와 AI를 장착한 네 발 로봇 개들이 인간 경비원보다 저렴한 대안으로 애틀랜타의 거리, 아파트, 건설 현장을 순찰하며 24시간 내내 360° 영상을 원격 운영자에게 스트리밍하고 있습니다.

Claude Code v2.1.98은 Vertex AI 마법사, 보안 수정 사항 및 서브프로세스 샌드박싱을 추가합니다.
Claude Code v2.1.98은 대화형 Google Vertex AI 설정 마법사를 도입하고, Linux에서 PID 네임스페이스 격리를 통한 서브프로세스 샌드박싱을 추가하며, Bash 권한 우회 및 임의 코드 실행 위험을 포함한 여러 보안 취약점을 수정합니다.