Галерея архитектур LLM: Визуальный справочник по проектам моделей

✍️ OpenClawRadar📅 Опубликовано: 16 марта 2026 г.🔗 Source
Галерея архитектур LLM: Визуальный справочник по проектам моделей
Ad

Галерея архитектур LLM Себастьяна Рашки — это коллекция схем архитектур и технических характеристик из The Big LLM Architecture Comparison и A Dream of Spring for Open-Weight LLMs, сфокусированная именно на панелях архитектур. Галерея включает интерактивные схемы, которые можно увеличить для детального просмотра, а названия моделей являются ссылками на соответствующие разделы статьи.

Ключевые детали моделей

Галерея предоставляет конкретные архитектурные спецификации для множества моделей:

  • Llama 3 8B: 8 млрд параметров, выпущена 2024-04-18, плотный декодер с GQA и RoPE вниманием, служит базовой моделью с предварительной нормализацией
  • OLMo 2 7B: 7 млрд параметров, выпущена 2024-11-25, плотный декодер с MHA и QK-Norm, использует пост-нормализацию внутри остаточного соединения вместо предварительной нормализации
  • DeepSeek V3: 671 млрд общих параметров (37 млрд активных), выпущена 2024-12-26, разреженный MoE-декодер с MLA вниманием, использует плотный префикс и общий экспертный слой
  • DeepSeek R1: 671 млрд общих параметров (37 млрд активных), выпущена 2025-01-20, разреженный MoE-декодер с MLA вниманием, архитектура совпадает с DeepSeek V3, но с обучением, ориентированным на рассуждения
  • Gemma 3 27B: 27 млрд параметров, выпущена 2025-03-11, плотный декодер с GQA и QK-Norm, использует соотношение скользящего/глобального внимания 5:1
  • Mistral Small 3.1 24B: 24 млрд параметров, выпущена 2025-03-18, плотный декодер со стандартным GQA, дизайн сфокусирован на низкой задержке с меньшим кэшем KV
  • Llama 4 Maverick: 400 млрд общих параметров (17 млрд активных), выпущена 2025-04-05, разреженный MoE-декодер с GQA вниманием, чередует плотные и MoE-блоки
  • Qwen3 235B-A22B: 235 млрд общих параметров (22 млрд активных), выпущена 2025-04-28, разреженный MoE-декодер с GQA и QK-Norm, оптимизирована для эффективности обслуживания без общего экспертного слоя
  • Qwen3 32B: 32 млрд параметров, выпущена 2025-04-28, плотный декодер с GQA и QK-Norm, эталонный плотный стек Qwen с 8 головами KV
  • Qwen3 4B: 4 млрд параметров, выпущена 2025-04-28, плотный декодер с GQA и QK-Norm, компактный стек со словарём в 151 тыс. токенов
  • Qwen3 8B: 8 млрд параметров, выпущена 2025-04-28, плотный декодер с GQA и QK-Norm, эталонный плотный стек Qwen3 с 8 головами KV
  • SmolLM3 3B: 3 млрд параметров, выпущена 2025-06-19, плотный декодер с GQA, экспериментирует с периодическими слоями NoPE
Ad

Практические особенности

Галерея включает трекер проблем для сообщения о неточных технических характеристиках, неправильно обозначенных архитектурах или неработающих ссылках. Доступна физическая версия постера через Zazzle с экспортом в высоком разрешении 14570 x 12490 пикселей (PNG-файл 56 МБ, 182 мегапикселя).

Для разработчиков, работающих с ИИ-агентами для программирования, этот ресурс предоставляет конкретные архитектурные детали, которые могут помочь в выборе модели, принятии решений по дообучению и оптимизации производительности. Формат сравнения бок о бок упрощает понимание компромиссов между различными архитектурными решениями.

📖 Read the full source: HN LLM Tools

Ad

👀 Смотрите также

Представляем cltree: текстовый интерфейс для файлового дерева для Claude Code
Инструменты

Представляем cltree: текстовый интерфейс для файлового дерева для Claude Code

<strong>cltree</strong> — это TUI с разделённой панелью, который в реальном времени отображает файловое дерево вашего проекта рядом с Claude Code, показывая текущую рабочую директорию, скрывая лишние файлы и позволяя всем нажатиям клавиш проходить без помех.

OpenClawRadar
Бенчмарк: Gemma4 12B против квантованной Qwen3 8B на Mac Mini с 24 ГБ памяти.
Инструменты

Бенчмарк: Gemma4 12B против квантованной Qwen3 8B на Mac Mini с 24 ГБ памяти.

Разработчик протестировал Gemma4 12B против Qwen3:8b-q4_K_M на Mac Mini с 24 ГБ памяти, используя два промпта. Qwen3 обрабатывал промпты в 4-5 раз быстрее, в то время как Gemma4 генерировала вывод немного быстрее.

OpenClawRadar
molequla: Постоянно обучающийся ИИ-организм, созданный с нуля с помощью ClaudeCode
Инструменты

molequla: Постоянно обучающийся ИИ-организм, созданный с нуля с помощью ClaudeCode

molequla — это постоянно обучающийся ИИ-организм, реализованный с нуля на Go, C, JavaScript и Rust с оркестратором на Python. Каждый элемент представляет собой полную реализацию трансформера с векторным автоградиентом, обученную на сыром тексте, которая со временем растёт и развивает личность.

OpenClawRadar
Claude-Code версии 2.1.76 добавляет функцию MCP-элиситации, оптимизации рабочих деревьев и множество исправлений.
Инструменты

Claude-Code версии 2.1.76 добавляет функцию MCP-элиситации, оптимизации рабочих деревьев и множество исправлений.

Claude-Code v2.1.76 представляет поддержку MCP-запросов для структурированного ввода в процессе выполнения задачи, добавляет worktree.sparsePaths для повышения эффективности работы с монорепозиториями и исправляет более 20 проблем, включая потерю схемы отложенных инструментов, проблемы с косыми командами и стабильность сессий Remote Control.

OpenClawRadar