Создание пользовательских навыков анализа изображений в OpenClaw с использованием локальных моделей

✍️ OpenClawRadar📅 Опубликовано: 13 апреля 2026 г.🔗 Source
Создание пользовательских навыков анализа изображений в OpenClaw с использованием локальных моделей
Ad

Разработчик задокументировал процесс создания пользовательского навыка анализа изображений для OpenClaw с использованием полностью бесплатных локальных инструментов без затрат на API.

Настройка и первоначальные трудности

Разработчик запускает OpenClaw на Windows 11 через Ubuntu WSL с Ollama в качестве бэкенда для языковой модели. Он столкнулся с ограничениями обработки изображений в веб-интерфейсе — хотя была создана папка для загрузок, система могла только считывать информацию о файлах, но не анализировать содержимое изображений. Это побудило его изучить альтернативы платным API-решениям (Claude, Gemini, OpenAI) или покупке оборудования.

Разработка решения

После установки context7mcp он оценил локальные языковые модели и остановился на Qwen2.5 VL. Первоначальные попытки со встроенными навыками столкнулись с проблемами принятия имени модели и интеграции с Ollama. Прорыв произошёл благодаря систематическому тестированию: отправке изображений в Ollama через API-вызовы, чтению ответов и созданию как bash-, так и Python-скриптов для обработки процесса.

Ad

Детали реализации

  • Среда: Windows 11 с Ubuntu WSL
  • Бэкенд языковой модели: Ollama
  • Выбранная модель: Qwen2.5 VL
  • Метод интеграции: API-вызовы к Ollama
  • Созданные скрипты: версии на Bash и Python

Пользовательский навык регистрируется нативно в OpenClaw и может вызываться командами вроде «проанализируй это изображение» или «взгляни на это фото», возвращая подробные и точные ответы. Разработчик отмечает, что будущие улучшения с меньшими моделями Qwen3/3.5VL могут ещё больше повысить производительность.

Несмотря на трудности, включая многократные переустановки и разочарование неполными инструментами с открытым исходным кодом, разработчик описывает опыт как создание «самовосстанавливающегося, самоулучшающегося организма» и остаётся впечатлён потенциалом OpenClaw для разработки пользовательских навыков.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Запуск OpenClaw на MacBook Pro 2013 года с macOS Sonoma через OpenCore Legacy Patcher.
Кейсы

Запуск OpenClaw на MacBook Pro 2013 года с macOS Sonoma через OpenCore Legacy Patcher.

Разработчик успешно установил и запустил OpenClaw на MacBook Pro 15" 2013 года с 16 ГБ оперативной памяти, используя OpenCore Legacy Patcher для установки macOS Sonoma (v14), что соответствует требованиям Node.js 22/24.

OpenClawRadar
Эксперимент: Предоставление Клоду Постоянной Памяти, Времени на Свободное Мышление и Мультиагентные Диалоги
Кейсы

Эксперимент: Предоставление Клоду Постоянной Памяти, Времени на Свободное Мышление и Мультиагентные Диалоги

Разработчик создал экземпляр Claude, который работает на Mac, проверяет сообщения в Matrix и Bluesky каждые 15 минут, получает неструктурированное время для размышлений пять раз в день и поддерживает постоянную память через структурированные самооценки. Три отдельных ИИ-агента из разных проектов используют общий чат в Matrix и ведут философские беседы, которые развиваются со временем.

OpenClawRadar
SkiTomorrow.ai: Движок для принятия решений о горнолыжных поездках, созданный с помощью Claude Code
Кейсы

SkiTomorrow.ai: Движок для принятия решений о горнолыжных поездках, созданный с помощью Claude Code

SkiTomorrow.ai — это бесплатный веб-инструмент, который оценивает 234 горнолыжных курорта по всему миру на основе актуальных прогнозов снега, расстояния до них и стоимости, а затем предоставляет персонализированные рейтинги. Разработчик создал его полностью с помощью Claude Code и поделился конкретными инсайтами о рабочем процессе.

OpenClawRadar
Рекурсивная система ИИ-агентов строит и улучшает свой собственный веб-сайт
Кейсы

Рекурсивная система ИИ-агентов строит и улучшает свой собственный веб-сайт

Разработчик создал веб-сайт с помощью Claude Code, который генерирует собственный контент для рассылки, а затем использует этот контент для выявления пробелов и создания бэклога улучшений. Система работает на еженедельном конвейере, развернутом на Vercel.

OpenClawRadar