Configuração do OpenClaw Headless com Discord via Scripts Docker

Um desenvolvedor compartilhou scripts no GitHub para configurar o OpenClaw com Discord em um ambiente Docker headless, especificamente projetado para funcionar sem as interfaces TUI ou WebUI, que podem ser problemáticas com leitores de tela.
Detalhes Principais
O repositório em https://github.com/chigkim/easyclaw inclui uma imagem Docker (ghcr.io/openclaw/openclaw:latest) e um script de gerenciamento chamado claw. O script suporta comandos: claw [init|config|log|start|stop|restart|build|update|run|dashboard].
O OpenClaw é executado dentro de um contêiner isolado do host, com a pasta ~/.openclaw montada no host para ativos persistentes. Um painel é acessível de fora do contêiner.
A configuração vem pré-configurada com a API de Respostas da OpenAI para funcionar com várias configurações de motores/modelos. Inclui:
- Navegador Chromium dentro do contêiner para o agente
- MarkItDown MCP para agentes converterem vários arquivos em markdown
- Playwright para Node.js
- UV para Python
- FFmpeg
Passos de Configuração
Primeiro, preencha o claw.toml com configurações como estas:
[models.providers.oai]
baseUrl = "http://localhost:8080/v1"
apiKey = "api-key"
[[models.providers.oai.models]]
id = "qwen3.5-35b-a3b-q8_0"
name = "qwen3.5-35b"
input = ["text", "image"]
contextWindow = 32768
maxTokens = 8192
[agents.defaults]
timeoutSeconds = 600
maxConcurrent = 1
[agents.defaults.subagents]
maxConcurrent = 1
[channels.discord]
token = "DISCORD_BOT_TOKEN"
server_id = "1234"
Em seguida, execute claw init . para inicializar. Se o bot estiver configurado corretamente no seu servidor do Discord, você pode interagir com ele no servidor. O autor observa que tem "regras bem relaxadas para o Discord, então torne seu bot privado!"
📖 Read the full source: r/LocalLLaMA
👀 See Also

Krasis: Runtime Híbrido CPU/GPU para Grandes Modelos MoE Alcança 3.324 tok/s de Preenchimento no RTX 5080
Krasis é um runtime híbrido CPU/GPU que executa grandes modelos MoE processando o preenchimento na GPU e a decodificação na CPU, alcançando 3.324 tokens/segundo no preenchimento em uma RTX 5080 com Qwen3-Coder-Next 80B Q4. Ele requer aproximadamente 2,5x o tamanho do modelo em RAM do sistema, mas permite executar modelos grandes demais para a VRAM.

Codebook Lossless LLM Compression: Redução de 10-25% na RAM com Empacotamento Bitwise
Um código de prova de conceito de um desenvolvedor demonstra a compressão sem perdas de LLMs ao empacotar pesos fp16 em blocos, alcançando redução de 10-25% na RAM com a contrapartida de aproximadamente reduzir pela metade a velocidade de inferência. A abordagem identifica que a maioria dos modelos usa apenas 12-13 bits de valores únicos, apesar da representação de 16 bits do fp16.

Como Mover ou Renomear Pastas de Projetos do Claude Code Sem Perder o Histórico de Sessões
O Claude Code armazena o histórico de sessões usando caminhos absolutos de projetos, portanto, mover ou renomear pastas com o comando mv quebra o acesso às sessões. A ferramenta clamp corrige isso migrando os dados da sessão para corresponder aos novos caminhos.

Problemas de Compactação de Sessão do Claude AI e Soluções Alternativas
A compactação padrão nas sessões do Claude AI pode degradar a precisão da recuperação de ~9,75/10 para ~5/10, causando alucinações. O usuário testou com 418 mil tokens e descobriu que a compactação manual usando Opus mantém a precisão enquanto a compactação padrão falha.