RelayCode Extensão do VS Code Roteia o Código do Claude Através de RDUs Soberanos

A OpenGPU lançou o RelayCode, uma extensão do VS Code que atua como um proxy local para agentes de codificação de IA. A ferramenta intercepta solicitações do Claude Code ou GitHub Copilot e as roteia através da rede OpenGPU Relay para modelos de código aberto executados em infraestrutura soberana.
Detalhes Principais
A extensão oferece vários recursos específicos e características de desempenho:
- Infraestrutura: As cargas de trabalho são roteadas através das unidades de fluxo de dados reconfiguráveis (RDUs) da Infercom, descritas como computação soberana dedicada sem jurisdição dos EUA e em conformidade com o GDPR por design.
- Desempenho: Os benchmarks mostram mais de 250 tokens por segundo no DeepSeek-R1 (671B) e mais de 400 tokens por segundo no MiniMax M2.5. A troca de modelos é quase instantânea (milissegundos) devido à arquitetura de fluxo de dados.
- Gerenciamento de Contexto: A extensão gerencia automaticamente as configurações
CLAUDE_AUTOCOMPACTpara manter os agentes dentro das janelas de contexto do modelo sem travamentos. - Privacidade: O código permanece na máquina local; apenas as solicitações de inferência atingem a rede de retransmissão, sem retenção de dados.
- Status Atual: A equipe relata cerca de 23 instalações e está buscando feedback da comunidade sobre a latência da retransmissão.
- Acesso: Créditos promocionais estão disponíveis para testar as velocidades das RDUs gratuitamente.
A ferramenta é posicionada como uma forma de reduzir os custos da API da Anthropic enquanto mantém os fluxos de trabalho do CLI do Claude, particularmente útil para trabalhos de refatoração.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Steerling-8B: Um Modelo de Linguagem Interpretável com Atribuição em Nível de Token
A Guide Labs lançou o Steerling-8B, um modelo de linguagem de 8 bilhões de parâmetros treinado em 1,35 trilhão de tokens que pode rastrear qualquer token gerado até o contexto de entrada, conceitos compreensíveis para humanos e fontes de dados de treinamento. O modelo alcança desempenho competitivo com modelos treinados em 2 a 7 vezes mais dados.

Adam CAD Harness Integra com Fusion e Onshape para Edição CAD Agêntica
O harness CAD agêntico da Adam agora é integrado ao Autodesk Fusion e ao PTC Onshape, lendo e editando árvores de recursos via linguagem natural. Instale com comandos de uma linha para macOS/Windows.

Assistente de impostos com IA de prioridade local, com dados pessoais criptografados, desenvolvido sobre MCP
Um desenvolvedor criou uma extensão para declaração de impostos para o Crow que criptografa todas as informações pessoais identificáveis (PII) com AES-256-GCM e funciona com qualquer cliente compatível com MCP, incluindo Claude, ChatGPT, Gemini ou modelos locais através do Ollama. O sistema processa cálculos localmente para o Formulário 1040, Anexo 1, HSA (8889), créditos educacionais (8863), trabalho autônomo (Anexo C/SE) e ganhos de capital (Anexo D).

rawq: Ferramenta CLI Local para Busca Semântica de Código por Agentes de IA
rawq é uma ferramenta CLI de código aberto que ajuda agentes de IA a encontrar código relevante usando busca semântica com um modelo local de 33MB via ONNX runtime e busca lexical BM25 via tantivy. Em testes, agentes de IA usando rawq consumiram 4 vezes menos tokens e completaram tarefas 2 vezes mais rápido em comparação com ferramentas cegas de leitura/grep.