ForgeAI: Визуальная рабочая платформа для инженерии моделей

ForgeAI — это настольный инструмент, созданный для упрощения локальной разработки моделей, предоставляющий визуальный интерфейс для инспекции, объединения и обучения AI моделей. После шести месяцев разработки этот инструмент создан с использованием Rust, Tauri v2, SvelteKit и llama.cpp и доступен для Linux, macOS (на Intel и Apple Silicon) и Windows.
Ключевые особенности
- Инспекция 3D моделей: Визуализируйте архитектуру модели, использование памяти и слои в трех измерениях, что позволяет более интуитивно понимать структуру модели.
- Объединение моделей: Предлагает интерфейс перетаскивания для объединения моделей с использованием 12 различных методов. Функция M-DNA Forge позволяет пользователям визуально выбирать и перетаскивать слои из различных моделей для создания новой "потомственной" модели.
- Обучение по слоям: Поддерживает обучение конкретных слоев с использованием технологий LoRA/QLoRA.
- Квантизация: Позволяет квантизацию моделей в форматы GGUF от Q2 до Q8.
Технические сложности и выводы
Разработка выявила сложность объединения моделей разных архитектур. Успешное объединение требует, чтобы модели принадлежали к одной семье и имели разницу в размере не более 1,2x. Произвольное объединение моделей, например, объединение модели 268M (640d) с моделью 999M (1152d), часто приводит к плохим результатам из-за того, что интерполяция размеров не равнозначна переносу знаний между различными архитектурами.
Инструмент особенно полезен для разработчиков, усталых от использования множества командных инструментов и YAML конфигураций, предоставляя универсальное решение для собственной разработки моделей.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Результаты тестирования: 15 языковых моделей проверены на 38 реальных рабочих задачах
Разработчик протестировал 15 облачных и локальных языковых моделей на 38 задачах из своего реального рабочего процесса, включая преобразование CSV, подсчёт букв, модульную арифметику и соответствие формату. Claude 3.5 Sonnet и Opus оба набрали 100%, но Sonnet стоит в 3,5 раза дешевле за вызов.

GLM-5-Turbo демонстрирует низкий уровень ошибок при вызове инструментов в пользовательском тестировании.
Модель z-ai/glm-5-turbo демонстрирует среднюю частоту ошибок при вызове инструментов в 0,57% в тестах, что значительно ниже показателя GLM-5 в ~3%. Пользователь сообщил об успешном использовании модели с CLI-инструментом для написания фэнтези-романа объёмом 97 000 слов с минимальными проблемами.

Mengram AI: Автоматический инструмент для запоминания сессий кода в Claude
Mengram AI автоматически поддерживает контекст между сессиями Claude Code, загружая когнитивные профили, внедряя релевантный прошлый контекст в промпты и сохраняя новые знания. Он хранит семантическую, эпизодическую и процедурную память, которая развивается на основе ошибок.

MCP позволяет Claude автоматически анализировать данные Google Search Console
Новый бесплатный MCP напрямую подключает Claude к Google Search Console, позволяя задавать запросы на естественном языке о данных производительности поиска, таких как запросы, страницы, клики и CTR, без необходимости ручного экспорта CSV.