Apresentando o Lean Collab: Um Orquestrador Multiagente para Tarefas de LLM de Longa Duração

Lean Collab é um orquestrador de código aberto desenvolvido pela Mutable State Inc., projetado para lidar com tarefas complexas e de longa duração, geralmente inadequadas para modelos de linguagem grandes (LLMs) de agente único. O orquestrador divide as tarefas em componentes gerenciáveis, delegando-os a subagentes que trabalham em paralelo e compartilham descobertas em tempo real.
Principais Recursos
- Decomposição de Tarefas: O agente orquestrador divide tarefas longas e intrincadas em atribuições menores para os subagentes lidarem.
- Subagentes Paralelos: Os subagentes executam suas tarefas simultaneamente, acelerando os tempos de processamento.
- Assinatura de Estado e Progresso da Tarefa: Acompanhe o progresso da tarefa com atualizações em tempo real, permitindo ajustes dinâmicos conforme necessário.
- Compartilhamento Intermediário em Tempo Real: Descobertas intermediárias entre os agentes são compartilhadas em tempo real para melhorar a eficiência e precisão geral da tarefa.
Esta configuração foi testada em problemas matemáticos complexos no nível Putnam, mas também se aplica à refatoração de software, construção de aplicativos e tarefas de pesquisa abrangentes.
Instalação e Configuração
Os pré-requisitos incluem a instalação do Lean 4 e do Mathlib. Configure seu ambiente instalando ferramentas como Rust e configurando o projeto Lean com as dependências apropriadas. Para autenticação, você precisará de uma chave de API do ensue.dev. Arquivos de configuração de exemplo e detalhes de configuração do ambiente são fornecidos na documentação de origem.
Para um passo a passo detalhado de configuração e código-fonte, é recomendado clonar o repositório e revisar o README para obter instruções sobre como configurar e implantar sua própria instância do Lean Collab.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

Codebook Lossless LLM Compression: Redução de 10-25% na RAM com Empacotamento Bitwise
Um código de prova de conceito de um desenvolvedor demonstra a compressão sem perdas de LLMs ao empacotar pesos fp16 em blocos, alcançando redução de 10-25% na RAM com a contrapartida de aproximadamente reduzir pela metade a velocidade de inferência. A abordagem identifica que a maioria dos modelos usa apenas 12-13 bits de valores únicos, apesar da representação de 16 bits do fp16.

X-MCP 2.0: Servidor MCP para Acesso à API do X/Twitter do Claude
X-MCP 2.0 é um servidor MCP que conecta o Claude Desktop e o Claude Code à API v2 do X/Twitter com autenticação OAuth 2.0 PKCE, fornecendo 10 ferramentas para postar tweets, buscar, obter timelines, curtir, retweetar, responder e visualizar perfis.

Cull: Mecanismo de Curadoria de Conjuntos de Dados de Código Aberto para Pipelines de Imagens de IA
O Cull coleta imagens de mais de 340 fontes, incluindo Civitai, X/Twitter, Reddit, Discord e sites booru, classifica-as com um modelo de visão-linguagem via LM Studio local ou Groq, e organiza em pastas de categorias com prompts SD e registros de auditoria.

NexQuant: Motor de cache KV de 3 bits nativo em Rust para implantação em borda
NexQuant é um mecanismo Rust robusto para produção que permite executar modelos de alto contexto em hardware de consumo com redução de memória de 3-5x. Ele suporta backends Metal, CUDA, Vulkan e CPU.