Две установки OpenClaw стоимостью $0 с использованием бесплатных облачных моделей или локального Ollama.

Пользователь OpenClaw сообщает о бесплатном запуске агента в течение трёх недель, который справляется примерно с 70% задач, ранее оплачиваемых с помощью Claude. Настройка предлагает два пути: бесплатные облачные модели с ограничениями по частоте запросов или локальные модели через Ollama с нулевыми текущими затратами.
Путь 1: Бесплатные облачные модели (аппаратное обеспечение не требуется)
Для этого подхода требуется только установленный OpenClaw и бесплатные API-тарифы:
- Бесплатный тариф OpenRouter: Зарегистрируйтесь на openrouter.ai без кредитной карты. Предлагает 30+ бесплатных моделей, включая Llama 3.3 70B, Nemotron Ultra 253B (контекст 262K), MiniMax M2.5 и Devstral. Пример конфигурации:
{
"env": { "OPENROUTER_API_KEY": "sk-or-..." },
"agents": {
"defaults": {
"model": {
"primary": "openrouter/nvidia/nemotron-ultra-253b:free"
}
}
}
}
Для автоматического выбора модели: "primary": "openrouter/openrouter/free"
- Бесплатный тариф Gemini: Google предоставляет 15 запросов в минуту для Gemini Flash бесплатно. Получите API-ключ на ai.google.dev и запустите
openclaw onboard, выбрав Google в качестве встроенного провайдера. - Groq: Быстрый сервис с ограниченным бесплатным тарифом, подходящим для базовых задач агента.
Подвох: ограничения по частоте запросов. При лёгком или умеренном ежедневном использовании (10-20 взаимодействий) паузы почти незаметны. Для 100+ задач в день это не сработает.
Путь 2: Локальные модели через Ollama (действительно $0, навсегда)
Ollama стал официальным провайдером OpenClaw в марте 2026 года. Эта настройка не требует API-ключей, аккаунтов, не имеет ограничений по запросам и не передаёт данные за пределы вашего компьютера.
Шаги настройки:
- Установите Ollama:
curl -fsSL https://ollama.com/install.sh | sh - Загрузите модель в зависимости от вашей VRAM:
- 20GB+ VRAM (RTX 3090, 4090, M4 Pro/Max):
ollama pull qwen3.5:27b - 16GB VRAM:
ollama pull qwen3.5:35b-a3b - 8GB VRAM (большинство ноутбуков):
ollama pull qwen3.5:9b
- 20GB+ VRAM (RTX 3090, 4090, M4 Pro/Max):
- Запустите
openclaw onboardи выберите Ollama, или используйте ручную настройку сexport OLLAMA_API_KEY="ollama-local"
Qwen3.5 27B отмечена как текущая оптимальная модель для OpenClaw, хорошо справляющаяся с вызовом инструментов для ежедневных задач агента. Вариант 35b-a3b с архитектурой mixture-of-experts работает со скоростью 112 токенов/сек на RTX 3090, активируя только 3B параметров за раз.
Пример ручной конфигурации:
{
"models": {
"providers": {
"ollama": {
"baseUrl": "http://localhost:11434",
"apiKey": "ollama-local",
"api": "ollama",
"models": [
{
"id": "qwen3.5:27b",
"name": "Qwen3.5 27B",
"reasoning": false,
"contextWindow": 131072,
"maxTokens": 8192
}
]
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "ollama/qwen3.5:27b"
}
}
}
}
Важные заметки по отладке:
- Используйте нативный URL API Ollama (
http://localhost:11434), НЕ совместимый с OpenAI (http://localhost:11434/v1). Путь /v1 ломает вызов инструментов, выводя сырой JSON как обычный текст. - Установите
"reasoning": falseв конфигурации модели.
📖 Прочитайте полный источник: r/clawdbot
👀 Смотрите также

Подключение CludeCode к веб-приложениям для автоматического взаимодействия.
Изучите, как CludeCode можно использовать для автоматического взаимодействия с веб-приложениями, применяя инструменты ИИ, такие как браузеры и утилиты для веб-скрейпинга.

Запуск Qwen3.6 27B и 35B на 6 ГБ VRAM с ik_llama: практические конфигурации и бенчмарки
Пользователь делится подробными конфигами ik_llama и показателями производительности для запуска моделей Qwen3.6 27B и 35B A3B на RTX2060 mobile (6 ГБ VRAM, 32 ГБ ОЗУ) со скоростью префилла 40-100 т/с и генерацией до 11 т/с.

Сократите затраты на токены на 95% с помощью семи техник оптимизации OpenClaw
Подробное руководство, описывающее семь методов снижения потребления токенов AI-агентами на 95%+, включая древовидные загрузочные файлы, автосжатие AI, перенос задач на локальную модель и фоновые задачи CPU по расписанию.

Трехуровневая архитектура памяти для постоянного контекста агента OpenClaw
Разработчик создал трехслойную систему памяти на основе инфраструктуры OpenClaw, чтобы предотвратить запуск агентов без контекста в начале каждой сессии. Архитектура включает L1 (рабочие файлы, внедряемые на каждом шаге), L2 (семантический поиск по памяти) и L3 (справочные документы, открываемые по требованию).