Relatórios de Pesquisa Profunda com Hermes Agent e Qwen3.6-35b-a3b: Um Guia Prático

Um usuário do Reddit com mais de 15 anos de pesquisa social para órgãos públicos detalha seu processo para gerar relatórios de pesquisa aprofundados usando Hermes Agent com o modelo qwen3.6-35b-a3b na quantização Q6_K. O objetivo era produzir relatórios no estilo McKinsey comparáveis ao resultado do Perplexity. Após cinco horas de processamento contínuo a ~28 tokens/segundo em um Intel Core de 12ª geração com 32 GB de RAM e uma RTX 4060 rodando Linux Mint, o agente produziu um relatório de 21 páginas sobre o estado atual da IA na Europa, com seis loops de refinamento iterativo, incluindo diagnóstico de problemas, correção, criação de gráficos e inserção — tudo quase de forma autônoma.
Detalhes Principais
- Modelo: qwen3.6-35b-a3b Q6_K (quantizado), rodando via Hermes Agent.
- Hardware: CPU Intel Core de 12ª geração, 32 GB de RAM, GPU RTX 4060, Linux Mint. Alcance de ~28 tokens/segundo.
- Fluxo de trabalho: O usuário executou seis loops no mesmo documento. Cada loop: gerar rascunho, diagnosticar problemas, corrigir problemas, adicionar gráficos, reinserir. O agente usou habilidades personalizadas (fornecidas no repositório) para compensar a habilidade integrada do Hermes Agent, considerada "deficiente".
- Saída: Relatório final nos formatos Markdown, DOCX e PDF. Todos os artefatos intermediários (prompts, meta-prompts, scripts Python, gráficos) estão incluídos no repositório.
- Conteúdo do repositório: Habilidades, prompts, meta-prompts, scripts Python, artefatos intermediários e o relatório final. O README e a estrutura de pastas também foram gerados por IA.
- Ressalvas do usuário: Falante não nativo de inglês (não editado por IA). Resultados descritos como "bastante aceitáveis" — não excelentes, mas um bom ponto de partida para uso em pesquisa pública.
Para Quem é
Desenvolvedores e pesquisadores que trabalham com geração de relatórios com IA, especialmente aqueles em administração pública ou pesquisa de políticas que desejam automatizar a criação de documentos longos usando LLMs locais.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Desenvolvedor Individual Constrói Ferramenta de Inteligência para Visto H-1B com Claude Code
Um desenvolvedor criou o H1B.Guru, uma ferramenta gratuita que processa mais de 800 mil registros de H-1B e PERM do Departamento do Trabalho dos EUA, usando Claude Code para toda a infraestrutura, desde o pipeline ETL até a implantação em produção.

Automatizando Relatórios Fiscais de Jogos de Azar da Receita Federal com OpenClaw
Um desenvolvedor utilizou o OpenClaw para extrair dados de transações do DraftKings, FanDuel e BetRivers, filtrar apostas de bônus, emparelhar apostas com pagamentos por meio de continuidade de saldo e gerar CSVs prontos para a Receita Federal e relatórios de auditoria em PDF em uma única sessão.

Construindo um aplicativo de livro de colorir generativo com Claude como Desenvolvedor Sênior
Um desenvolvedor iOS intermediário detalha como o Claude ajudou a identificar casos extremos e implementar proteções de segurança ao construir um aplicativo de livro de colorir em SwiftUI para crianças.

O vLLM 0.17.0 modificado roda em Tesla P40 para transcrição em tempo real com Qwen3 ASR 1.7B
Um desenvolvedor modificou o vLLM 0.17.0 para rodar em GPUs Tesla P40 com arquitetura Pascal, alcançando aceleração de hardware quase completa para transcrição de aulas em tempo real usando o modelo Qwen3 ASR 1.7B. A versão modificada está disponível no GitHub.