Физика-агент от Hugging Face: 2x Gemini на CritPt

Hugging Face выпустила physics-intern — открытый мультиагентный фреймворк, предназначенный для исследований в области теоретической физики. Он имитирует процесс научного исследования, разбивая сложные задачи на целевые подзадачи, которые выполняются специализированными субагентами — включая агенты вычислений, проверки утверждений и стратегии исследования.

Архитектура и рабочий процесс

Фреймворк разбивает задачи исследовательского уровня на несколько подзадач, каждая из которых обрабатывается выделенным субагентом:

Агент вычислений: выполняет численные расчеты и симуляции.
Агент проверки: оценивает утверждения на корректность и согласованность.
Агент стратегии: критикует общее направление исследования и предлагает альтернативы.

Эта агентная обвязка спроектирована как доменно-независимая, но была специально настроена для теоретической физики.

Производительность на бенчмарках

На бенчмарке CritPt (анализ критических точек в физике) physics-intern удвоил производительность моделей Gemini и достиг нового state-of-the-art результата, превзойдя GPT-5.5 Pro — и все это со значительно более низкой стоимостью. Конкретные цифры в источнике не указаны, но улучшение описывается как «удвоение» и «новый SOTA».

Доступность

Фреймворк доступен как Hugging Face Space. Статья в блоге с подробным описанием архитектуры и проектных решений находится по ссылке ниже. Приветствуются вклады сообщества и расширения.

Для кого предназначен: Исследователям и разработчикам, создающим агентные рабочие процессы для научных областей, особенно теоретической физики.

📖 Read the full source: r/LocalLLaMA

Hugging Face Physics-Intern: Мультиагентная структура удваивает Gemini в бенчмарке CritPt

Архитектура и рабочий процесс

Производительность на бенчмарках

Доступность

👀 Смотрите также

SkyClaw: Автономная среда выполнения ИИ-агентов на Rust

Agents Elements: панель управления macOS для установок Claude Code и Codex

Терминальный 3D-рендерер, созданный с помощью мультиагентной системы кодирования Claude

iai-mcp: Локальный демон обеспечивает Клоду постоянную память между сессиями с 99% точностью воспроизведения