Проверка структурных галлюцинаций с открытым исходным кодом для конвейеров ИИ-агентов

✍️ OpenClawRadar📅 Опубликовано: 11 марта 2026 г.🔗 Source
Проверка структурных галлюцинаций с открытым исходным кодом для конвейеров ИИ-агентов
Ad

Что он делает

Проверка структурных галлюцинаций, специально разработанная для конвейеров ИИ-агентов. В отличие от проверки фактов, этот инструмент фокусируется на обнаружении структурных сбоев, которые нарушают работу последующих инструментов.

Какую проблему решает

Большинство проблем агентов связаны не с фактическими ошибками, а со структурными проблемами, такими как:

  • Модель придумывает поле в JSON-ответе инструмента
  • Ссылка на источник, которого нет в полученном наборе
  • Инъекция промпта, скрытая внутри полученного контента
  • Утверждение, что инструмент вернул что-то, чего он не возвращал

Четыре супрессора

Инструмент включает четыре встроенных супрессора, работающих на Claude Code, которые выполняются как единый шаг перед тем, как вывод агента достигнет пользователей:

  • grounding_enforcer - проверяет, действительно ли вывод модели поддерживается переданными источниками
  • prompt_suppressor - обнаруживает попытки инъекций в полученном контенте и результатах инструментов
  • json_suppressor - проверяет структурированные ответы инструментов на соответствие ожидаемым схемам
  • tool_response_suppressor - помечает случаи, когда заявленный вывод инструмента не соответствует фактическому результату
Ad

Доступность

Инструмент доступен в двух форматах:

  • REST API
  • MCP-сервер (работает с Claude Desktop, Cursor, Windsurf и др.)

Бесплатный тариф предлагает 500 запросов/месяц без необходимости предоставления данных кредитной карты.

Источник и документация

Репозиторий GitHub: https://github.com/steveswain14/mcp-hallucination-suite

API и документация: https://certifai.dev

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

🦀
Инструменты

MTP + Unified Memory повышает производительность вывода llama.cpp на 30% на RTX 5090

Включение MTP-спекуляции вместе с GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 повышает скорость Qwen3.6-27B Q8_0 с 49 до 64 ток/сек на RTX 5090 с 128 ГБ системной памяти.

OpenClawRadar
ClaudeMeter: Приложение с открытым исходным кодом для macOS в строке меню для отслеживания использования Claude в реальном времени
Инструменты

ClaudeMeter: Приложение с открытым исходным кодом для macOS в строке меню для отслеживания использования Claude в реальном времени

ClaudeMeter — это бесплатное приложение с открытым исходным кодом для macOS, которое размещается в строке меню и предназначено для подписчиков Claude Max. Оно отображает проценты использования за сессию и за неделю, таймеры сброса и индикаторы темпа работы, не прерывая рабочий процесс. Вся программа была создана с помощью Claude (Claude Code/Opus) для кода на Swift, бэкенда на Supabase и Edge Functions.

OpenClawRadar
Детектор утечек Swarm: Бесплатный инструмент для поиска открытых API-ключей в конфигурациях OpenClaw
Инструменты

Детектор утечек Swarm: Бесплатный инструмент для поиска открытых API-ключей в конфигурациях OpenClaw

Разработчик выпустил swarm-leak-detector — инструмент с лицензией MIT без зависимостей, который сканирует более 21 шаблона учетных данных (OpenAI, Anthropic, OpenRouter, Stripe и др.) в текстовых JSON-файлах конфигурации. Запустите его с помощью npx swarm-leak-detector scan ~/.clawdbot/, чтобы проверить наличие утечек примерно за 30 секунд.

OpenClawRadar
Плагин Creative Excellence для Claude Code повышает качество анимации с помощью тезиса взаимодействия
Инструменты

Плагин Creative Excellence для Claude Code повышает качество анимации с помощью тезиса взаимодействия

Новый плагин с открытым исходным кодом для Claude Code решает проблему создания шаблонных анимаций, внедряя подход 'интерактивной концепции', при котором Claude должен сначала описать идею движения, прежде чем писать код. Плагин включает 8 поднавыков, охватывающих GSAP, Framer Motion, CSS-анимации и принципы дизайна из изученных репозиториев.

OpenClawRadar