Anthropic의 llama.cpp 기반 자연어 오토인코더를 위한 UI 및 서버

✍️ OpenClawRadar📅 게시일: May 13, 2026🔗 Source
Ad

Anthropic의 첫 오픈 가중치 모델인 Natural Language Autoencoder(NLA)는 널리 사용되는 오픈 가중치 아키텍처의 파인튠입니다. 기본 모델 아키텍처나 모델링 코드를 수정하지 않기 때문에 llama.cpp를 사용한 추론은 간단합니다. 한 개발자가 NLA의 모든 기능(활성화 추출, 활성화 설명, 활성화 재구성, 설명 편집 기반 조종)을 맞춤형 llama.cpp 서버에 통합하고, Mikupad UI를 통해 토큰 수준의 활성화 설명 및 조종을 제공합니다.

주요 기능

  • 활성화 추출: 기본 모델의 임의 레이어에서 내부 활성화를 추출합니다.
  • 활성화 설명: 추출된 활성화에 대해 사람이 읽을 수 있는 설명을 얻습니다.
  • 활성화 재구성: 설명에서 활성화를 재구성합니다.
  • 설명 편집 기반 조종: 설명을 수정하고 그에 따라 모델 출력을 조종합니다.

기술 세부 사항

서버는 llama.cpp 위에 구축되었으며, 기본 모델, 행위자 모델, 비평가 모델의 세 가지 모델을 동시에 로드해야 합니다. 이는 메모리 집약적인 설정입니다. 개발자는 LoRA 기반 버전을 작업 중이며, 단일 모델을 메모리에 로드하여 메모리 사용량을 크게 줄일 수 있습니다.

Mikupad UI는 활성화 설명 및 조종을 위한 토큰 수준 인터페이스를 제공합니다. 어떤 토큰이 특정 기능을 활성화하는지 검사하고, 실시간으로 설명을 편집하여 모델 동작을 조정할 수 있습니다.

시작하기

소스 코드와 설정 방법은 Reddit에서 확인할 수 있습니다. 현재 세 가지 NLA 모델 체크포인트(기본, 행위자, 비평가)를 보유하고 맞춤형 llama.cpp 서버를 컴파일해야 합니다. LoRA 버전은 곧 제공될 예정입니다.

📖 전체 소스 읽기: r/LocalLLaMA

Ad

👀 See Also

Quanta-SDK v0.9.2는 AI 에이전트를 통한 양자 회로 실행을 위한 MCP 서버를 추가합니다.
Tools

Quanta-SDK v0.9.2는 AI 에이전트를 통한 양자 회로 실행을 위한 MCP 서버를 추가합니다.

Quanta-SDK v0.9.2는 이제 Claude나 GPT와 같은 AI 에이전트에게 양자 회로를 실행하고 해석할 수 있는 도구를 제공하는 MCP(Model Context Protocol) 서버를 포함합니다. 이 서버는 IBM 하드웨어에서의 회로 실행, 결과 해석, 노이즈 분석, 양자 금융 가격 책정 등 20개 이상의 도구를 제공합니다.

OpenClawRadar
GPT-5.1과 Claude 4.6을 활용한 다중 에이전트 거래 위원회 시스템
Tools

GPT-5.1과 Claude 4.6을 활용한 다중 에이전트 거래 위원회 시스템

한 개발자가 ZagiHQ를 오케스트레이션에 사용하여 세 개의 병렬 데이터 수집 에이전트와 세 개의 LLM(GPT-5.1, Claude 4.6 Opus, Claude 4.6 Sonnet)로 구성된 다중 에이전트 트레이딩 시스템을 구축했습니다. 이 시스템은 의견 불일치를 통해 매매 설정을 걸러내며 수동 승인이 필요합니다.

OpenClawRadar
🦀
Tools

니들: FFN 전혀 없이 구축된 2600만 파라미터 도구 호출 모델

Needle은 MLP가 없는 26M 파라미터 함수 호출 모델로, 소비자 기기에서 6000 tok/s 프리필과 1200 tok/s 디코드를 달성합니다. 단일 호출 도구 호출에서 FunctionGemma-270M, Qwen-0.6B, Granite-350M, LFM2.5-350M을 능가합니다.

OpenClawRadar
antrez의 DS4: Mac Metal 및 DGX에서 1M 컨텍스트로 DeepSeek V4 Flash 실행하기
Tools

antrez의 DS4: Mac Metal 및 DGX에서 1M 컨텍스트로 DeepSeek V4 Flash 실행하기

Redis 창시자 Salvatore Sanfilippo가 Mac Metal 하드웨어와 DGX에서 1M 컨텍스트 윈도우로 DeepSeek V4 Flash를 실행하고, 에이전트 코딩 도구를 위한 OpenAI/Anthropic 엔드포인트를 제공하는 프로젝트 DS4를 출시했습니다.

OpenClawRadar