Kimi K2.6 против Claude Opus 4.7: Практическое тестирование с модом доски объявлений Minetest

✍️ OpenClawRadar📅 Опубликовано: 5 мая 2026 г.🔗 Source
Kimi K2.6 против Claude Opus 4.7: Практическое тестирование с модом доски объявлений Minetest
Ad

Интересное реальное сравнение двух моделей на странной задаче по программированию: создание игрового мода доски объявлений для Minetest/Luanti с бэкендом на TypeScript, а затем его расширение с логированием в Google Sheets через Composio. Обе модели получили одинаковые промпты. Подробности в исходном посте.

Настройка

  • Claude Opus 4.7: через Claude Code
  • Kimi K2.6: через OpenCode на OpenRouter
  • Задача: игрок заходит в мир, выполняет /bounty, получает задание, выполняет его, получает награду, бэкенд записывает выполнение. Второй тест: логировать выполнение в Google Sheets через Composio.

Цены

  • Opus 4.7: $5/М вход, $25/М выход
  • Kimi K2.6: $0.95/М вход, $4/М выход (кэшированный вход $0.16/М)

Тест 1: Локальная доска объявлений

Opus 4.7: Чистый MVP. Бэкенд Express/Zod/Vitest, Lua-мод, флоу /bounty, награды, таблица лидеров, тесты пройдены. Статистика:

  • Стоимость: ~$3.59
  • Время: 12мин API, 23мин общее
  • Код: +1,688 / -0
  • Выходные токены: 54.8k
  • Кэш чтения: 2.8M

Kimi K2.6: Тоже запустил локальную доску, но менее чисто. Написал 4,671 строк кода (+4,671 / -0) против 1,688 у Opus — более чем в 2 раза больше кода. Стоимость: ~$0.39. Время: ~9мин 27сек. Раздражающая часть: конфигурация Minetest. Он записал secure.http_mods = bountykimi в глобальную конфигурацию, но создал конфигурацию мира с другим именем мода, так что HTTP API не был включён для работающего мода. У тестировщика ушло 30+ минут на отладку.

Ad

Тест 2: Composio + Google Sheets

Opus 4.7: Синхронизация с Google Sheets заработала. После некоторых обсуждений по tsx watch и загрузке env, бэкенд смог завершать задания и добавлять данные в таблицу. Статистика:

  • Стоимость: $16.03
  • Время: 28мин API, 1ч 17мин общее
  • Код: +1,848 / -507
  • Кэш чтения: 22.3M
  • Выход: 123.3k токенов

Kimi K2.6: Провалился. Застрял на проблемах с dev-сервером, тестами и сборкой. Так и не смог довести интеграцию с Composio до рабочего состояния. После ~25 минут и 135k+ токенов тестировщик остановился. Стоимость: ~$5.03.

Выводы

  • Лучший локальный MVP: Opus, но Kimi даёт гораздо лучшее соотношение цены и качества
  • Лучшая реальная интеграция: Opus, и с большим отрывом
  • Чистый код: Opus
  • Более дешёвая модель для экспериментов: Kimi

Тестирование показывает, что Kimi K2.6 интересен для более дешёвых локальных задач по программированию — за $0.39 получить работающий мод на Lua+TypeScript неплохо. Но как только задача включает внешние инструменты, проблемы с конфигурацией и реальную интеграционную работу, Opus 4.7 явно впереди.

Полный разбор с коммитами, скриншотами, демонстрациями и стоимостью по ссылке на источник.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Обновление OpenClaw 2026.3.2 отключает инструменты агента по умолчанию.
Новости

Обновление OpenClaw 2026.3.2 отключает инструменты агента по умолчанию.

OpenClaw 2026.3.2 отключает все разрешения для инструментов агентов по умолчанию, что не позволяет работать таким инструментам, как exec и web_fetch. Для исправления требуется добавить конфигурацию в файл openclaw.json.

OpenClawRadar
Claude Code v2.1.73: Переопределения моделей, исправления стабильности и улучшения производительности
Новости

Claude Code v2.1.73: Переопределения моделей, исправления стабильности и улучшения производительности

Claude Code v2.1.73 добавляет modelOverrides для пользовательских идентификаторов провайдеров, исправляет критические зависания и взаимные блокировки, решает проблему понижения версий моделей у суб-агентов и улучшает стабильность голосового режима. В выпуске устранены 18 конкретных проблем, включая запросы разрешений для bash-команд, повреждение сессий и сбои песочницы Linux.

OpenClawRadar
Трамп отзывает указ об ИИ из-за опасений замедления технологического развития США
Новости

Трамп отзывает указ об ИИ из-за опасений замедления технологического развития США

Президент Трамп отменил указ Байдена об ИИ, сняв федеральные требования к отчетности по безопасности для моделей ИИ. Он сослался на риск ослабления технологического превосходства США над Китаем.

OpenClawRadar
Claude.ai, API и Claude Code испытывают повышенное количество ошибок
Новости

Claude.ai, API и Claude Code испытывают повышенное количество ошибок

Claude.ai, Claude API и Claude Code в настоящее время испытывают повышенное количество ошибок, веб-интерфейс и консоль разработчика недоступны. Вход в Claude Code через Claude.ai не работает, хотя уже вошедшие пользователи могут продолжать им пользоваться.

OpenClawRadar