Ling-2.6-1T 출시: 희소 어텐션 하이브리드 1조 파라미터 오픈소스 모델

inclusionAI가 Ling 제품군의 1조 매개변수 플래그십 모델인 Ling-2.6-1T를 오픈소스로 공개했습니다. 이 모델은 복잡한 실제 작업을 대상으로 합니다. Multi-head Latent Attention (MLA)과 Linear Attention을 결합한 하이브리드 아키텍처를 도입하여 추론 효율성을 개선하고, 긴 컨텍스트에서 지연 시간과 VRAM 사용량을 낮추면서 표현력을 유지합니다.

보상 전략을 통한 빠른 사고

포스트 트레이닝에는 Contextual Process Redundancy Suppression 보상 전략을 사용하여 더 짧고 직접적인 출력을 장려합니다. 이는 장황한 사고 체인에 대한 의존도를 줄이는 '빠른 사고' 메커니즘으로, 성능을 유지하면서 토큰 오버헤드를 줄입니다.

벤치마크 최고 성능

Ling-2.6-1T는 실행 중심 벤치마크에서 오픈소스 최고 성능을 달성합니다:

AIME26 (추론)
SWE-bench Verified (소프트웨어 엔지니어링)
BFCL-V4 (함수 호출)
TAU2-Bench (작업 완료)
IFBench (명령 수행)

에이전트 통합

이 모델은 코드 생성부터 버그 수정까지 엔드투엔드 엔지니어링 워크플로를 위해 설계되었으며, Claude Code, OpenClaw, OpenCode, CodeBuddy를 포함한 주요 에이전트 프레임워크와 통합됩니다. 엔터프라이즈 환경에서 다중 도구, 다중 단계 제약 조건을 처리합니다.

📖 전체 소스 읽기: r/LocalLLaMA

inclusionAI, Ling-2.6-1T 출시: 희소 어텐션과 빠른 사고를 갖춘 하이브리드 아키텍처의 조 단위 파라미터 모델

보상 전략을 통한 빠른 사고

벤치마크 최고 성능

에이전트 통합

👀 See Also

얀 르쿤의 AMI, AI 월드 모델에 10억 달러 투자 유치, LLM 접근법에 도전장

AI 쿼리 효율성을 위한 적응형 추론 경로 제안

Anthropic의 감정 벡터 논문은 아첨과 사랑이 동일한 메커니즘을 공유한다는 것을 보여줍니다

앤트로픽, AI 개발 전면 중단 촉구하며 자기 개선 위험 경고