Проверка структурных галлюцинаций с открытым исходным кодом для конвейеров ИИ-агентов

Что он делает
Проверка структурных галлюцинаций, специально разработанная для конвейеров ИИ-агентов. В отличие от проверки фактов, этот инструмент фокусируется на обнаружении структурных сбоев, которые нарушают работу последующих инструментов.
Какую проблему решает
Большинство проблем агентов связаны не с фактическими ошибками, а со структурными проблемами, такими как:
- Модель придумывает поле в JSON-ответе инструмента
- Ссылка на источник, которого нет в полученном наборе
- Инъекция промпта, скрытая внутри полученного контента
- Утверждение, что инструмент вернул что-то, чего он не возвращал
Четыре супрессора
Инструмент включает четыре встроенных супрессора, работающих на Claude Code, которые выполняются как единый шаг перед тем, как вывод агента достигнет пользователей:
grounding_enforcer- проверяет, действительно ли вывод модели поддерживается переданными источникамиprompt_suppressor- обнаруживает попытки инъекций в полученном контенте и результатах инструментовjson_suppressor- проверяет структурированные ответы инструментов на соответствие ожидаемым схемамtool_response_suppressor- помечает случаи, когда заявленный вывод инструмента не соответствует фактическому результату
Доступность
Инструмент доступен в двух форматах:
- REST API
- MCP-сервер (работает с Claude Desktop, Cursor, Windsurf и др.)
Бесплатный тариф предлагает 500 запросов/месяц без необходимости предоставления данных кредитной карты.
Источник и документация
Репозиторий GitHub: https://github.com/steveswain14/mcp-hallucination-suite
API и документация: https://certifai.dev
📖 Read the full source: r/ClaudeAI
👀 Смотрите также
MTP + Unified Memory повышает производительность вывода llama.cpp на 30% на RTX 5090
Включение MTP-спекуляции вместе с GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 повышает скорость Qwen3.6-27B Q8_0 с 49 до 64 ток/сек на RTX 5090 с 128 ГБ системной памяти.

ClaudeMeter: Приложение с открытым исходным кодом для macOS в строке меню для отслеживания использования Claude в реальном времени
ClaudeMeter — это бесплатное приложение с открытым исходным кодом для macOS, которое размещается в строке меню и предназначено для подписчиков Claude Max. Оно отображает проценты использования за сессию и за неделю, таймеры сброса и индикаторы темпа работы, не прерывая рабочий процесс. Вся программа была создана с помощью Claude (Claude Code/Opus) для кода на Swift, бэкенда на Supabase и Edge Functions.

Детектор утечек Swarm: Бесплатный инструмент для поиска открытых API-ключей в конфигурациях OpenClaw
Разработчик выпустил swarm-leak-detector — инструмент с лицензией MIT без зависимостей, который сканирует более 21 шаблона учетных данных (OpenAI, Anthropic, OpenRouter, Stripe и др.) в текстовых JSON-файлах конфигурации. Запустите его с помощью npx swarm-leak-detector scan ~/.clawdbot/, чтобы проверить наличие утечек примерно за 30 секунд.

Плагин Creative Excellence для Claude Code повышает качество анимации с помощью тезиса взаимодействия
Новый плагин с открытым исходным кодом для Claude Code решает проблему создания шаблонных анимаций, внедряя подход 'интерактивной концепции', при котором Claude должен сначала описать идею движения, прежде чем писать код. Плагин включает 8 поднавыков, охватывающих GSAP, Framer Motion, CSS-анимации и принципы дизайна из изученных репозиториев.