Ограничения распознавания речи Claude и обходной путь пользователя с помощью Spokenly и Parakeet TDT

Проблемы с распознаванием речи Claude и техническое обходное решение
Пользователь на r/ClaudeAI сообщает о значительных проблемах со встроенной функцией транскрипции с микрофона в Claude. Хотя они предпочитают Claude ChatGPT за рассуждения, ценности и интеллект, они считают, что функция распознавания речи создаёт больше работы, чем экономит, из-за неточности.
Пользователь противопоставляет это распознаванию речи ChatGPT, которое они описывают как «почти волшебное» — точное, правильно пунктуированное и способное исправлять оговорки.
Реализация технического обходного решения
Потратив день на поиск решения, пользователь нашёл рабочий обходной путь:
- Установил Spokenly на Mac
- Настроил его с моделью Parakeet TDT от NVIDIA
- Добился бесперебойной работы с Claude
Результат был описан как «фантастический», хотя пользователь отмечает, что обычному пользователю не пришлось бы внедрять такое решение.
Ограничения платформы и доступные альтернативы
Пользователь сообщает, что на iPhone «практически нет хорошего решения вообще». Они указывают, что лучшие технологии уже существуют и являются открытыми, конкретно упоминая:
- Whisper Large-v3
- Parakeet TDT
Обе модели свободно доступны и описаны как «явно лучше того, что использует Claude в настоящее время». Пользователь характеризует это как «низко висящий плод» для компании Anthropic, отмечая, что конкурентный разрыв с ChatGPT «смущающий».
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

OpenClaw проводит свое первое AMA: Взгляды на AI-кодирующих агентов
OpenClaw, известная фигура в области AI-кодирования, провела свою первую AMA-сессию на Reddit. Обсуждение прояснило ее воздействие, планы на будущее и вызовы.
Настройки системы Claude Code v2.1.139: Документация платформы Claude на AWS, безопасность обобщения, инструменты PowerShell
CC 2.1.139 (+2 248 токенов): добавлены справочные документы Claude Platform на AWS с аутентификацией SigV4, безопасное обобщение разговоров с сохранением инструкций, таблица соответствия команд Unix и PowerShell, а также ряд улучшений навыков и промптов.

Судебный приказ в Джорджии содержит юридические ссылки, сгенерированные искусственным интеллектом с ошибками
Апелляция в Верховном суде Джорджии выявила, что постановление суда первой инстанции содержало как минимум пять ссылок на несуществующие дела и ещё пять на дела, которые не подтверждают указанные в них положения, причём предложенный прокурором проект постановления содержал те же ошибки.

Структурированный рабочий процесс побеждает режим планирования и суперсилы в тесте AI DES
Рабочий процесс Ouroboros занял первое место в бенчмарке AI-assisted Discrete-Event Simulation, превзойдя режим планирования Claude и подход с суперспособностями fat-skill, используя структурированный цикл уточнить-спланировать-выполнить-оценить-восстановить-повторить.