Gemma 4 выпущена: четыре размера моделей для локального размещения ИИ

Спецификации модели Gemma 4
Gemma 4 теперь доступна как самоуправляемая ИИ-модель с четырьмя различными конфигурациями для разных сценариев использования оборудования. Согласно источнику, она не конкурирует с Claude, Codex или Gemini, а позиционируется как практичный вариант для многомаршрутных сценариев, где небольшая, но способная самоуправляемая модель может экономить токены.
Варианты моделей и требования к оборудованию
- E2B (2,3 млрд эффективных параметров): Создана для периферийных устройств, таких как телефоны и Raspberry Pi. Требует ~4-8 ГБ оперативной памяти и хорошо работает на процессоре. Рекомендуется для размещения на VPS.
- E4B (4,5 млрд эффективных параметров): Создана для ноутбуков и недорогого оборудования. Сохраняет низкое потребление памяти.
- 26B MoE (25 млрд всего, 3,8 млрд активных): Создана для потребительских графических процессоров. Работает со скоростью вывода, аналогичной модели на 4 млрд параметров.
- 31B Dense: Создана для графических процессоров среднего класса и рабочих станций. Требует примерно 16-20 ГБ видеопамяти при использовании 4-битного квантования.
Возможности и доступность
Все модели Gemma 4 являются мультимодальными с возможностями обработки текста и изображений. Модели для периферийных устройств E2B и E4B специально поддерживают работу с аудио в реальном времени. Модели созданы для расширенного логического вывода и агентных рабочих процессов.
Gemma 4 доступна в Google AI Studio, Hugging Face, Kaggle и Ollama.
📖 Read the full source: r/openclaw
👀 Смотрите также

Claude Code 2.1.132: Многоагентные документы, планирование шлюзов, изменения ограничений навыков
Релиз v2.1.132 добавляет документацию по Managed Agents для мультиагентных сессий, результатов и вебхуков; вводит шлюз по умолчанию для проактивных предложений /schedule; снижает задокументированный лимит навыков с 64 до 20 на агента.

Клод Код Сабагенты Не Загружают Навыки в Мультиагентных Системах
Разработчик сообщает, что суб-агенты в Claude Code v2.1.91 не могут получить доступ к навыкам, определённым в директории .claude/skills/, несмотря на то, что навыки идеально работают в основной сессии. Несколько подходов, включая указание навыков во фронтмете агента, инструмент Skill, флаги CLI и команды агентов, не дают результата.

Сравнение затрат на API для LLM в 2026 году: самостоятельное размещение и облачные провайдеры
Пользователь Reddit сравнил стоимость API LLM для 1 млн токенов в день у 11 провайдеров, выяснив, что самостоятельный хостинг с vLLM стоит около $0,05 за 1 млн токенов, в то время как GPT-4o стоит $5/$15 за входные/выходные токены.

Ошибка подписки Claude Pro: платные пользователи застряли на бесплатном тарифе
Ошибка в Claude Pro после использования подарочного пропуска оставляет аккаунты на бесплатном плане, несмотря на успешную оплату и получение чеков. Поддержка Anthropic не отвечает в течение недели.