Использование Claude Haiku в качестве фильтра для снижения затрат на API Sonnet на 80%

Разработчик поделился экономически эффективным подходом для обработки больших объёмов неструктурированного текста с помощью моделей Claude AI. Этот метод использует Claude Haiku в качестве фильтра для отсеивания нерелевантного контента перед отправкой только ценных данных в более дорогую модель Claude Sonnet.
Проблема и решение
Разработчик создал платформу под названием PainSignal (painsignal.net), которая собирает тысячи реальных комментариев от работников и владельцев бизнеса из разных отраслей, а затем классифицирует их в структурированные идеи для приложений. Большая часть входных данных была бесполезной — комментарии вроде "отличное видео", "первый" или случайный шум. Отправка всего этого в Sonnet была бы невероятно дорогой.
Двухэтапный конвейер
Этап 1 — Haiku в качестве фильтра: Каждый комментарий сначала обрабатывается Haiku с простым запросом: "Содержит ли этот комментарий реальное разочарование, жалобу или неудовлетворённую потребность, связанную с чьей-либо работой?" Модель возвращает да/нет и показатель уверенности. Это стоит доли цента за вызов и отфильтровывает около 85% входных данных.
Этап 2 — Sonnet для основной работы: Только комментарии, прошедшие фильтр, отправляются в Sonnet. Здесь происходит дорогостоящая обработка — модель извлекает основную проблему, классифицирует её по отрасли и категории (без предопределённого списка, таксономия строится динамически), присваивает оценку серьёзности и генерирует концепции приложений с функциями и моделями монетизации.
Результаты и детали реализации
В результате Sonnet обрабатывает примерно 15% от общего объёма входных данных вместо 100%, что обеспечивает значительную экономию при обработке тысяч комментариев.
Ключевые выводы из реализации:
- Haiku удивительно хорошо справляется с ролью фильтра — модель последовательно выявляет реальные жалобы с небольшим количеством ложноотрицательных результатов
- Динамический подход к таксономии (предоставление Sonnet возможности определять категории вместо их предварительного определения) выявил категории, о которых разработчик никогда бы не подумал
- Пакетная обработка помогает на стороне Sonnet — всё помещается в очередь через BullMQ и обрабатывается контролируемыми пакетами, чтобы избежать перегрузки API
Вся система была построена с помощью Claude Code с использованием Next.js, Postgres с pgvector и связанных технологий.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Проверка идей продуктов с помощью Claude Code и демонстраций Remotion
Разработчик использовал Claude Code и Remotion для создания 60-секундной концепт-демонстрации инструмента TypeScript YouTube MCP перед написанием какого-либо продакшен-кода, потратив около 2 часов в общей сложности. Демо подтвердило идею, показав семантический поиск по 50 лекциям с использованием sqlite-vec и без необходимости API-ключа.

Непрограммист создает инструменты для астрологических историй с помощью Claude API.
77-летний человек без технического образования создал Fortune Cast и Ember Cast, используя Claude в качестве основного помощника, создавая персонализированные астрологические истории на основе позиций планет и личных данных.

Журнал разработки игр Claude: Уроки и стек разработки агентного Three.js
Разработчик делится практическими уроками создания игры Three.js Line Rider полностью с помощью Claude AI, включая Git worktrees, TypeScript-подход, административные слайдеры для ограничений ИИ и стек технологий с использованием Firebase, WebSockets и детерминированной пошаговой симуляции.

Пользователь OpenClaw переходит на RunLobster для управляемой инфраструктуры.
Разработчик потратил 4 месяца на устранение проблем с OpenClaw, включая зависание агентов, сбои конфигураций и непредсказуемые затраты на API, прежде чем перейти на RunLobster. Те же модели и фреймворк работали надежно с выполнением многошаговых задач и более быстрой интеграцией.