Google Research представляет TurboQuant для сжатия моделей искусственного интеллекта

✍️ OpenClawRadar📅 Опубликовано: 25 марта 2026 г.🔗 Source

Что делает TurboQuant

TurboQuant — это набор продвинутых алгоритмов квантования, которые обеспечивают значительное сжатие для больших языковых моделей и векторных поисковых систем. Он специально решает узкие места в кэше ключ-значение — высокоскоростной системе хранения, которая сохраняет часто используемую информацию под простыми метками для мгновенного доступа.

Как это работает

TurboQuant достигает значительного уменьшения размера модели без потери точности с помощью двух ключевых шагов:

Высококачественное сжатие (метод PolarQuant): Начинается со случайного вращения векторов данных для упрощения геометрии, затем применяет стандартный квантователь к каждой части вектора отдельно. На этом этапе используется большая часть мощности сжатия для сохранения основной концепции и силы исходного вектора.
Устранение скрытых ошибок: Использует небольшой остаточный объём мощности сжатия (всего 1 бит) для применения алгоритма QJL к крошечному количеству ошибок, оставшихся после первого этапа. QJL действует как математический проверщик ошибок, который устраняет смещения, приводя к более точным оценкам внимания.

Ключевые компоненты

QJL (Quantized Johnson-Lindenstrauss): Использует преобразование Джонсона-Линденштраусса для сжатия высокоразмерных данных с сохранением расстояний между точками данных. Он сокращает каждое результирующее векторное число до одного знакового бита (+1 или -1) с нулевыми накладными расходами памяти. Использует специальный оценщик, который балансирует высокоточные запросы с низкоточными данными для точного расчёта оценок внимания.

PolarQuant: Решает проблему накладных расходов памяти, преобразуя векторы в полярные координаты с использованием декартовой системы координат. Вместо стандартных координат (X, Y, Z) он использует формат, сравнимый с «Пройти 5 блоков в общей сложности под углом 37 градусов», а не «Пройти 3 блока на восток, 4 блока на север».

Технический контекст

Традиционное векторное квантование обычно вводит накладные расходы памяти в 1-2 дополнительных бита на число из-за хранения констант квантования для каждого небольшого блока данных. TurboQuant оптимально решает эту проблему. Техники показали перспективность в тестировании для уменьшения узких мест ключ-значение без ущерба для производительности моделей ИИ.

TurboQuant будет представлен на ICLR 2026, а PolarQuant — на AISTATS 2026.

📖 Read the full source: HN AI Agents

👀 Смотрите также

Инструменты

ClearSpec: Генератор спецификаций для снижения галлюцинаций в коде Claude

ClearSpec — это инструмент, который генерирует структурированные спецификации из простых описаний на английском языке, подключается к репозиториям GitHub для ссылок на реальные пути к файлам и зависимости, а затем использует эти спецификации в качестве промптов для Claude Code, чтобы предоставить более качественный контекст.

21 апр. 2026 г., 18:25 UTC

OpenClawRadar

Инструменты

ClamBot: ИИ-агент выполняет код, сгенерированный LLM, в песочнице WASM для обеспечения безопасности

ClamBot — это фреймворк для AI-агентов, который выполняет весь код, сгенерированный LLM, в песочнице WebAssembly с использованием QuickJS в Wasmtime, устраняя необходимость в вызовах exec() или подпроцессов. Он включает шлюз одобрения для вызовов инструментов, постоянное кэширование скриптов в виде «clams» и поддерживает несколько провайдеров LLM.

13 апр. 2026 г., 12:45 UTC

OpenClawRadar

Инструменты

Cloudflare Dynamic Worker Loader: Изоляция AI-агентов с помощью изолятов

Динамический загрузчик воркеров Cloudflare, который теперь находится в открытой бета-версии, позволяет воркерам создавать новые воркеры с кодом, указанным во время выполнения, в изолированных песочницах с использованием изолятов V8, обеспечивая запуск в 100 раз быстрее, чем контейнеры, и без глобальных ограничений на параллелизм.

24 мар. 2026 г., 20:45 UTC

OpenClawRadar

Инструменты

Открытые навыки работы с кодом Claude для персонализированного контента в социальных сетях

Разработчик открыл исходный код 13 навыков Claude Code, которые помогают Claude создавать контент для социальных сетей в вашем собственном стиле. Навыки включают инструменты для определения контекста, стратегии, создания и анализа для LinkedIn, Twitter/X, Threads и Bluesky.

30 мар. 2026 г., 05:45 UTC

OpenClawRadar