devopsiphai: Открытый исходный код Claude Code проводит аудит операционного здоровья по 6 фазам.

devopsiphai — это открытый навык Claude Code, который проводит аудит операционного здоровья производственных проектов. Он работает как навык внутри Claude Code и оценивает проекты по шести этапам, чтобы ответить на пять ключевых операционных вопросов.
Что он оценивает
Навык отвечает на эти пять вопросов о проекте:
- Может ли пользователь (ИИ) легко начать работу?
- Можно ли его безопасно развернуть?
- Знаю ли я, что работает и где?
- Могу ли я видеть, что происходит в реальном времени?
- Могу ли я восстановиться, если что-то пойдет не так?
Система оценки
Проекты оцениваются с использованием ARC-фреймворка:
- Автоматизация
- Отчетность
- Контроль
Инструмент выставляет буквенную оценку по каждому столпу. По словам создателя, оценка «в основном служит для геймификации, чтобы мотивировать моих клиентов стремиться к оценке A».
Техническая реализация
Аудит проходит через шесть этапов:
- Этап 1 запускает 17 параллельных суб-агентов — по одному на каждый раздел — каждый проводит фактическое исследование без предложений или оценок
- Справочные файлы загружаются лениво, только когда эта область активно аудируется, чтобы сохранить контекст легким
- Этап 6 полностью генерирует TODO.md на основе результатов предыдущих этапов
Результат
Инструмент генерирует структурированный файл TODO.md с атомарными задачами, оцененными по трудозатратам, на основе результатов аудита.
Тестирование в реальных условиях
Создатель запустил devopsiphai на реальном SaaS-приложении в производстве. Полученная ARC-оценка составила D/D/F.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

motif MCP предоставляет Claude Code возможность просмотра видео для воспроизведения ошибок интерфейса
motif — это MCP-сервер, который позволяет Claude Code просматривать записи экрана с UI-багами, используя покадровый анализ Gemini 2.5 Flash для возврата визуальных описаний, первопричин и диффов. Для настройки нужен ключ Gemini API и две строки в mcp.json.

Итан AI: Европейский хаб API для моделей ИИ — переориентируется как альтернатива OpenRouter
Eden AI предлагает единый унифицированный API для доступа к более чем 500 моделям ИИ (LLM, компьютерное зрение, OCR, речь) с умной маршрутизацией, механизмами отказоустойчивости и контролем региона. Позиционируется как европейская альтернатива OpenRouter.

PhAIL Benchmark Проверяет Модели VLA на Реальных Задачах Складских Роботов
PhAIL — это бенчмарк для реальных роботов, который тестирует четыре модели «зрение-язык-действие» на задаче подбора заказов из ящика в ящик с использованием робота Franka FR3. Лучшая модель показала результат 64 единицы в час, в то время как при телеуправлении человеком достигается 330 ед./ч, а при ручной работе человека — более 1300 ед./ч.

Creation OS: Локальная σ-затворная среда выполнения LLM, позволяющая моделям говорить «Я не знаю» вместо галлюцинаций
Creation OS оборачивает локальные LLM (BitNet, Qwen, Gemma, любые GGUF) с σ-затвором, который измеряет несколько каналов неопределенности и принимает решение ACCEPT, RETHINK или ABSTAIN для каждого вывода. Без облака, без API. Точность TruthfulQA улучшена ~29% за счет селективной регенерации.