Таллас HC1: Ускорение ИИ-инференса с помощью индивидуального silicon.

✍️ OpenClawRadar📅 Опубликовано: 20 февраля 2026 г.🔗 Source
Таллас HC1: Ускорение ИИ-инференса с помощью индивидуального silicon.
Ad

Taalas запустила новую платформу HC1, специально разработанную для ИИ-инференсов с использованием индивидуального кремния. Этот подход трансформирует ИИ-модели в специализированное оборудование, значительно оптимизируя производительность и затраты. Платформа HC1 основана на трех основных принципах: полной специализации, объединении хранения и вычислений, а также радикальном упрощении.

Первый продукт, представленный в рамках этой платформы, представляет собой жестко запрограммированную реализацию модели Llama 3.1 8B. Тесты производительности демонстрируют почти 10-кратное увеличение скорости до 17,000 токенов в секунду на пользователя по сравнению с текущими системами ИИ-инференса. Кроме того, данное решение в 20 раз дешевле и потребляет в 10 раз меньше энергии.

Ключевые инновации заключаются в разрушении традиционной границы между памятью и вычислениями. Это достигается путем интеграции памяти и вычислений в одном чипе, что позволяет приблизить плотность DRAM для повышения оперативной эффективности и экономичности.

Ad

Реализация Llama 3.1 8B также предлагает гибкость с настраиваемыми размерами контекстного окна и возможностью тонкой настройки через низкоранговые адаптеры. Этот продукт ориентирован на разработчиков, ищущих эффективные и экономически выгодные решения ИИ, особенно в средах, где задержка и потребление энергии являются критическими ограничениями.

📖 Читать полный источник: HN AI Agents

Ad

👀 Смотрите также

🦀
Новости

Opus 4.7 может следовать ~500 инструкциям, по сравнению с ~150 год назад

Исследование, обновленное в мае 2026 года, показывает, что Opus 4.7 может надежно следовать примерно 500 инструкциям, по сравнению с примерно 150 в июле 2025 года. GPT-5.5 справляется примерно с 5000. Последствия для размера файла CLAUDE.md.

OpenClawRadar
GitHub Copilot переходит на тарификацию по использованию: конец субсидированного ИИ-кодирования
Новости

GitHub Copilot переходит на тарификацию по использованию: конец субсидированного ИИ-кодирования

Microsoft начнет взимать с пользователей GitHub Copilot плату в соответствии с фактической стоимостью моделей с 1 июня 2026 года, прекратив субсидирование в размере $20+ в месяц на пользователя. Причиной названо использование агентного ИИ.

OpenClawRadar
Клод удваивает лимиты использования вне пиковых часов на две недели.
Новости

Клод удваивает лимиты использования вне пиковых часов на две недели.

Anthropic временно удваивает лимиты использования Claude вне пиковых часов для всех тарифных планов. В будние дни вне периода 5–11 утра PT/12–6 вечера GMT доступно 2-кратное использование, а на выходных — 2-кратное использование в течение всего дня.

OpenClawRadar
Два сотрудника Департамента внутренних дел ЮАР отстранены за галлюцинации ИИ в политическом документе
Новости

Два сотрудника Департамента внутренних дел ЮАР отстранены за галлюцинации ИИ в политическом документе

Два чиновника были отстранены после того, как в списке литературы пересмотренной Белой книги по гражданству, иммиграции и защите беженцев были обнаружены галлюцинации ИИ. Департамент внедрит проверки ИИ и пересмотрит все политические документы, начиная с ноября 2022 года.

OpenClawRadar