Разработчик рассматривает переход с DeepSeek на Grok для создания финансового AI-агента

✍️ OpenClawRadar📅 Опубликовано: 19 марта 2026 г.🔗 Source

Проблемы с производительностью финансового ИИ-агента и возможный переход

Разработчик создал финансовое веб-приложение с ИИ на FastAPI/Python, которое работает аналогично Perplexity, но для акций. Перед обработкой запросов языковой моделью приложение запускает параллельный конвейер, включающий получение актуальных котировок акций из нескольких финансовых API, актуальный веб-поиск через финансовые поисковые API и данные календаря отчетностей. Весь этот структурированный контекст добавляется в системный промпт, при этом модель отвечает только за рассуждения и форматирование, а фактические данные поступают из API, что делает уровень галлюцинаций менее важным для данного случая использования.

Текущие проблемы с производительностью модели

В настоящее время разработчик использует DeepSeek V3.2 Reasoning и сообщает о значительных проблемах с производительностью:

TTFT (Время до первого токена): ~70 секунд
Скорость вывода: ~25 токенов в секунду
Опыт потоковой передачи описан как "ужасный"
Таймаут начала потока установлен на 75 секунд, чтобы избежать постоянных сбоев

Требования приложения

Финансовый ИИ-агент имеет две основные функции:

Поток чата: Финансовый анализ в стиле Perplexity со встроенными ссылками на источники
Поток проверки сделок: Торговый коуч, который выдает рекомендации GO/NO-GO/WAIT с указанием точки входа, стоп-лосса, цели и соотношения риск/прибыль

Требования к модели включают:

Высокая производительность с низким TTFT и высокой скоростью токенов в секунду для удобства потоковой передачи
Низкая стоимость для небольшого проекта
Достаточный интеллект для многошаговых торговых рассуждений
Хорошее следование инструкциям для строгих форматов вывода при проверке сделок

Рассмотрение Grok 4.1 Fast Reasoning

Разработчик рассматривает переход на Grok 4.1 Fast Reasoning на основе следующих сравнений:

TTFT: ~15 секунд (против ~70с у DeepSeek)
Скорость вывода: ~75 токенов в секунду (против ~25 т/с у DeepSeek)
Оценка интеллекта AA: 64 против 57 у DeepSeek
Стоимость ввода: $0,20 против $0,28 за миллион токенов

Другие рассматриваемые модели

Разработчик также рассматривал Minimax 2.5, Kimi K2.5, новые модели Qwen 3.5 и Gemini 3 Flash, но отмечает, что большинство из них относительно дорогие и не лучше подходят для их конкретного случая использования.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Кейсы

OpenClaw перерос чат — Панель управления — это недостающая опция по умолчанию

Пользователь Reddit описывает, как запуск OpenClaw через Telegram перестает справляться с ростом числа рабочих процессов, и почему веб-панель (например, созданная им самостоятельно) должна быть стандартным подключаемым интерфейсом для агентских инструментов.

9 мая 2026 г., 18:16 UTC

OpenClawRadar

Кейсы

Проблемы с маршрутизацией в OpenClaw Orchestrator: Когда делегирование не работает

Разработчик сообщает, что их основной оркестратор OpenClaw примерно в 40-50% случаев неправильно обрабатывает запросы самостоятельно вместо того, чтобы направлять их к специализированным суб-агентам, несмотря на использование явной таблицы маршрутизации и правил делегирования. В настройку входят 7 специализированных агентов для таких сервисов, как Gmail, Todoist, Notion и погода.

13 апр. 2026 г., 14:45 UTC

OpenClawRadar

Кейсы

Разработчик создает приложение для бухгалтерского учета на основе ИИ с использованием Claude Code

Разработчик создал AICountant — приложение для бухгалтерского учёта на основе ИИ для фрилансеров и малого бизнеса, используя Claude Code во всём стеке технологий, включая Next.js App Router, Prisma с PostgreSQL и Vercel Blob storage. Приложение извлекает данные с чеков, конвертирует иностранные валюты по историческим курсам и организует всё в поисковый реестр.

16 апр. 2026 г., 05:45 UTC

OpenClawRadar

Кейсы

Клод Код ИИ-агент управляет физическим iPhone через API доступности

Разработчик продемонстрировал, как Claude Code автономно управляет физическим iPhone через приложение Blitz для Mac, используя WebDriverAgent и API доступности с обходным решением в виде свайпа нулевой длины для нажатий.

26 февр. 2026 г., 07:45 UTC

OpenClawRadar