Публикации по теме 'speech-recognition'


Выполнение многоязычных голосовых запросов к финансовым документам
Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE , где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python: — Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw . — Эксперимент в блокноте Jupyter, доступен по..

Создание субтитров с помощью OpenAI Whisper
Ключевые выводы Обзор OpenAI Whisper и его производительность по сравнению с другими системами автоматического распознавания речи Коммерческий API Whisper и собственное решение Whisper: преимущества и недостатки Как использовать Whisper с Python Место Whisper с точки зрения качества перевода по сравнению с другими моделями машинного перевода Как еще больше улучшить качество транскрипции аудио Мой проект для просмотра видео на YouTube с качественными субтитрами Введение Когда..

Вопросы по теме 'speech-recognition'

Пользовательские словари для распознавания речи в Windows
Используя распознавание речи Windows7, я хочу создать специализированные словари для распознавания естественного языка предметной области в частях моего приложения. Таким образом, например, конкретное поле ввода текста может быть связано с его...
1012 просмотров
schedule 06.05.2024

Как я могу использовать распознавание речи для выполнения веб-поиска
Я хочу, чтобы когда я прошу свою программу открыть хром, она спрашивает меня, чего я хочу. Поиск, и я говорю, что я хочу найти, и он ищет это, но у меня есть некоторые проблемы, и я также не могу найти много в Интернете. public partial class...
866 просмотров
schedule 18.04.2024

Петля обратной связи распознавания речи
Я работаю над системой распознавания речи, чтобы разговаривать с моим компьютером. Теперь у меня компьютерный аудиовыход настроен на систему объемного звука. Это вызвало проблемы для системы распознавания. Например, когда я говорю «тест», чтобы...
812 просмотров
schedule 03.05.2024

CTC: В чем разница между пробелом и пробелом?
В статье 2006 года о временной классификации коннекционистов Алекс Грейвс и др. представила модель декодирования речи с 27 метками: 26 для букв алфавита и одна для пробела , что означает отсутствие метки (что я понимаю как молчание ). Тем не...
972 просмотров