Toroidal Logit Bias: простой трюк на инференсе снижает галлюцинации на 40%

✍️ OpenClaw Radar📅 Опубликовано: 7 февраля 2026 г.🔗 Source
Toroidal Logit Bias: простой трюк на инференсе снижает галлюцинации на 40%
Ad

Исследователи разработали простой метод логит-бая, который снижает фактические галлюцинации без дообучения или RAG. Техника может быть применена к любой локальной модели во время вывода.

Как это работает

Метод отображает идентификаторы токенов на тор (тороидальную поверхность) размером 12x12, затем увеличивает логиты для токенов, которые "близки" к недавним токенам в этом тороидальном пространстве. Только первые 1-3K токенов подвергаются баю — применение его к полному словарю ухудшает производительность.

Результаты

  • Qwen 2.5-7B: на 40% меньше фактических ошибок
  • OLMo 1.7-7B: на 15.4% меньше фактических ошибок
  • TruthfulQA (817 запросов): +6.8% улучшение по сравнению с Qwen
  • Стоимость производительности: ~5% медленнее генерация

Реализация

Основная логика состоит примерно из 30 строк Python. Каждая модель требует своих гиперпараметров — Qwen работает лучше всего с alpha=0.3, radius=2.0, N=1440, в то время как OLMo нуждается в alpha=0.2, radius=3.0, N=3000.

Демо: huggingface.co/spaces/paraxiom-research/topological-coherence

Статья: doi.org/10.5281/zenodo.18516477

Код: github.com/Paraxiom/topological-coherence

Ad

Почему это важно

Это достижение в методах логит-бая имеет значительное значение для экосистемы AI-агентов, так как оно решает критическую проблему фактических галлюцинаций, которая была основным препятствием для развертывания надежных AI-моделей. Улучшая точность выводов без обширного переобучения, этот метод может привести к более надежным AI-приложениям в различных областях, от обслуживания клиентов до генерации контента.

Ключевые выводы

  • Этот метод может значительно снизить фактические ошибки, при этом Qwen демонстрирует 40% улучшение.
  • Он работает во время вывода, что делает его простым в реализации без необходимости сложного дообучения.
  • Подход адаптируем к различным моделям, каждая из которых требует специфических гиперпараметров для оптимальной производительности.
  • Хотя он эффективен, существует небольшая компенсация в скорости производительности, с увеличением времени генерации на ~5%.

Как начать

Чтобы реализовать метод тороидального логит-бая, начните с доступа к предоставленному репозиторию кода на GitHub. Ознакомьтесь с документацией для вашей конкретной модели, чтобы понять необходимые гиперпараметры. После настройки вашей среды вы можете легко интегрировать технику логит-бая в ваш существующий конвейер вывода. Для практического опыта ознакомьтесь с демо-ссылкой, чтобы увидеть метод в действии.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Меморин: Локальная система памяти для агентов OpenClaw с использованием Python и SQLite
Инструменты

Меморин: Локальная система памяти для агентов OpenClaw с использованием Python и SQLite

Memorine — это локальная система памяти для агентов OpenClaw, использующая только Python и SQLite, без внешних зависимостей, API-вызовов или телеметрии. Она предоставляет хранение фактов с полнотекстовым поиском, затухание памяти, обнаружение противоречий, причинно-следственное связывание событий и опциональный семантический поиск через fastembed и sqlite-vec.

OpenClawRadar
Бенчмарк MemAware показывает, что память агентов на основе RAG не справляется с неявным извлечением контекста.
Инструменты

Бенчмарк MemAware показывает, что память агентов на основе RAG не справляется с неявным извлечением контекста.

Бенчмарк MemAware проверяет, могут ли ИИ-агенты извлекать релевантный прошлый контекст, когда пользователи явно об этом не спрашивают, показывая, что текущие системы памяти демонстрируют точность всего 2,8% на сложных неявных запросах против 0,8% без памяти.

OpenClawRadar
OctoArch v5.0: Среда выполнения B2B с нулевым доверием и ИИ-персонажами на основе JSON
Инструменты

OctoArch v5.0: Среда выполнения B2B с нулевым доверием и ИИ-персонажами на основе JSON

OctoArch v5.0 — это когнитивная среда выполнения с нулевым доверием для B2B, созданная для строгих корпоративных сценариев использования, таких как извлечение данных из фискальных документов и счетов. Она заменяет текстовые промпты JSON-определяемыми персонами ИИ и реализует изоляцию путей для предотвращения атак на сервер.

OpenClawRadar
onWatch: Открытый локальный трекер квот API с хранением в SQLite
Инструменты

onWatch: Открытый локальный трекер квот API с хранением в SQLite

onWatch — это локальный трекер квот API, который хранит все данные в локальной базе данных SQLite без использования облачных сервисов, телеметрии или регистрации аккаунтов. Это единый исполняемый файл (~13 МБ), работающий как фоновый демон с использованием <50 МБ оперативной памяти и предоставляющий панель управления на localhost.

OpenClawRadar