AskAlf: 셀프 호스팅 AI 워크플로우를 위한 오픈소스 멀티 에이전트 오케스트레이션 플랫폼

AskAlf의 기능
AskAlf는 자체 하드웨어에서 실행되도록 설계된 오픈소스 멀티 에이전트 오케스트레이션 플랫폼입니다. 단일 에이전트 도구와 달리, 자율 시스템을 통해 조율되는 전문 작업자를 동적으로 생성합니다.
주요 기술 특징
- 의미적, 일화적, 절차적 메모리를 결합한 10계층 인지 메모리 시스템
- PostgreSQL과 pgvector 확장을 사용한 메모리 저장
- 자체 지식을 검토하고 문제 발견 시 조사 티켓을 생성하는 자율 시스템
- 적절한 작업자에게 티켓을 배치하고 해결 상황을 추적
- 시간이 지남에 따라 유용한 패턴을 강화하는 메모리 통합 (예: 100번째 보안 스캔은 정확히 어디를 살펴봐야 할지 앎)
현재 구현 사항
- AI 제공자로 Claude와 OpenAI 사용
- 아키텍처는 모델에 독립적
- 로컬 모델 지원 (Ollama, vLLM)은 계획 중
기술 스택
TypeScript, PostgreSQL + pgvector, Redis, Docker, MCP Protocol로 구축되었습니다.
설치
curl을 통한 빠른 설치:
curl -fsSL https://get.askalf.org | bash소스 및 저장소
GitHub 저장소: https://github.com/askalf/askalf
📖 Read the full source: r/LocalLLaMA
👀 See Also

아우라 리서치: 로컬 도구가 문서를 영구 메모리를 갖춘 AI 탐색 가능 위키로 컴파일합니다
Aura Research는 원본 문서(PDF, 논문, 노트, 코드, 60개 이상의 형식)를 백링크된 글, 개념 페이지, 마스터 인덱스가 포함된 구조화된 마크다운 위키로 처리하는 오픈소스 도구입니다. 모든 것을 RAG 검색에 최적화된 .aura 아카이브로 압축하며, 데이터가 사용자의 기기를 떠나지 않고 100% 로컬에서 실행됩니다.

NLA가 Gemma 3의 내부 활성화를 모든 토큰에 대해 읽을 수 있는 텍스트로 변환
Anthropic이 모델의 내부 상태를 텍스트로 디코딩하는 NLA(Natural Language Autoencoders)를 발표했습니다. Gemma 3와 함께, Auto Verbalizer는 생성된 모든 토큰에 대해 모델이 "생각"한 내용을 설명합니다. 가중치는 Hugging Face에, 데모는 Neuronpedia에 있습니다.

클로드 토큰 카운터에 모델 비교 기능이 추가되었습니다
Simon Willison의 Claude 토큰 카운터 도구가 이제 다른 Claude 모델 간 토큰 수 비교를 지원합니다. 이 업데이트는 Opus 4.7이 업데이트된 토크나이저로 인해 Opus 4.6보다 1.0~1.35배 더 많은 토큰을 사용함을 보여주며, 동일한 가격에도 불구하고 약 40% 더 비쌀 수 있습니다.

클로드 디스패치 베타: 설정 팁과 초기 소감
한 개발자가 Mac Mini에서 Claude의 Dispatch 베타를 설정한 경험을 공유하며, 지속적인 가동 시간, 구체적인 성공 기준, 그리고 Computer Use를 활성화한 상태에서의 적극적인 권한 설정의 필요성을 강조합니다.