inclusionAI, Ling-2.6-1T 출시: 희소 어텐션과 빠른 사고를 갖춘 하이브리드 아키텍처의 조 단위 파라미터 모델

✍️ OpenClawRadar📅 게시일: April 29, 2026🔗 Source
inclusionAI, Ling-2.6-1T 출시: 희소 어텐션과 빠른 사고를 갖춘 하이브리드 아키텍처의 조 단위 파라미터 모델
Ad

inclusionAI가 Ling 제품군의 1조 매개변수 플래그십 모델인 Ling-2.6-1T를 오픈소스로 공개했습니다. 이 모델은 복잡한 실제 작업을 대상으로 합니다. Multi-head Latent Attention (MLA)Linear Attention을 결합한 하이브리드 아키텍처를 도입하여 추론 효율성을 개선하고, 긴 컨텍스트에서 지연 시간과 VRAM 사용량을 낮추면서 표현력을 유지합니다.

보상 전략을 통한 빠른 사고

포스트 트레이닝에는 Contextual Process Redundancy Suppression 보상 전략을 사용하여 더 짧고 직접적인 출력을 장려합니다. 이는 장황한 사고 체인에 대한 의존도를 줄이는 '빠른 사고' 메커니즘으로, 성능을 유지하면서 토큰 오버헤드를 줄입니다.

벤치마크 최고 성능

Ling-2.6-1T는 실행 중심 벤치마크에서 오픈소스 최고 성능을 달성합니다:

  • AIME26 (추론)
  • SWE-bench Verified (소프트웨어 엔지니어링)
  • BFCL-V4 (함수 호출)
  • TAU2-Bench (작업 완료)
  • IFBench (명령 수행)

에이전트 통합

이 모델은 코드 생성부터 버그 수정까지 엔드투엔드 엔지니어링 워크플로를 위해 설계되었으며, Claude Code, OpenClaw, OpenCode, CodeBuddy를 포함한 주요 에이전트 프레임워크와 통합됩니다. 엔터프라이즈 환경에서 다중 도구, 다중 단계 제약 조건을 처리합니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

OpenClaw Docker 사용자분들께: 2026.3.13 업데이트에 누락된 Docker 태그
News

OpenClaw Docker 사용자분들께: 2026.3.13 업데이트에 누락된 Docker 태그

OpenClaw 버전 2026.3.13이 출시되었지만, Docker 사용자는 업데이트를 피해야 합니다. Docker 이미지에 'latest'와 '2026.3.13' 태그가 모두 없기 때문입니다. npm이나 git에서 실행하는 사용자는 영향을 받지 않습니다.

OpenClawRadar
AI 데이터 센터 금융 구조의 소송 위험
News

AI 데이터 센터 금융 구조의 소송 위험

AI 데이터센터 건설은 2030년까지 5.2조 달러의 인프라 투자가 필요하며, 기업들은 SPV와 GPU 담보 시설 같은 복잡한 금융 구조를 사용하여 9가지 유형의 소송 위험을 초래하고 있습니다.

OpenClawRadar
🦀
News

오퍼스 4.7 추론 노력 벤치마크: 실제 작업에서 중간이 높음과 최대를 능가

GraphQL-go-tools 저장소의 29개 태스크에서 Claude Code의 Opus 4.7이 중간 추론 노력 수준에서 최고 성능을 보였습니다. 더 높은 설정은 정확성을 떨어뜨리고 비용을 증가시켰으며 패치 품질은 개선되지 않았습니다.

OpenClawRadar
클로드 코드의 속도 제한은 100만 컨텍스트 윈도우 과부하 때문일 수 있습니다
News

클로드 코드의 속도 제한은 100만 컨텍스트 윈도우 과부하 때문일 수 있습니다

레딧 사용자는 Claude Code의 최근 속도 제한과 중단이 Opus 4.6의 100만 토큰 컨텍스트 윈도우에서 비롯된 것으로 추측하며, 이로 인해 비효율적인 컨텍스트 압축과 서버 과부하가 발생하고 있을 수 있다고 주장합니다. 구형 비-100만 컨텍스트 모델로 전환하면 안정성이 개선된다는 보고가 있습니다.

OpenClawRadar