Публикации по теме 'speech-recognition'
Выполнение многоязычных голосовых запросов к финансовым документам
Это видео представляет собой подробный технический обзор демонстрации, представленной на https://youtu.be/I_hqzdqQ5vE , где я запускаю многоязычные голосовые запросы к финансовым документам, используя две современные модели Transformer для преобразования речи в текст и семантического поиска в менее 100 строк Python:
— Подготовка набора данных на основе файлов SEC, загруженных с помощью AWS SDK. Подробнее см. https://youtu.be/SU1L6f0N6iw .
— Эксперимент в блокноте Jupyter, доступен по..
Создание субтитров с помощью OpenAI Whisper
Ключевые выводы
Обзор OpenAI Whisper и его производительность по сравнению с другими системами автоматического распознавания речи Коммерческий API Whisper и собственное решение Whisper: преимущества и недостатки Как использовать Whisper с Python Место Whisper с точки зрения качества перевода по сравнению с другими моделями машинного перевода Как еще больше улучшить качество транскрипции аудио Мой проект для просмотра видео на YouTube с качественными субтитрами
Введение
Когда..
Вопросы по теме 'speech-recognition'
Пользовательские словари для распознавания речи в Windows
Используя распознавание речи Windows7, я хочу создать специализированные словари для распознавания естественного языка предметной области в частях моего приложения. Таким образом, например, конкретное поле ввода текста может быть связано с его...
1012 просмотров
schedule
06.05.2024
Как я могу использовать распознавание речи для выполнения веб-поиска
Я хочу, чтобы когда я прошу свою программу открыть хром, она спрашивает меня, чего я хочу.
Поиск, и я говорю, что я хочу найти, и он ищет это, но у меня есть некоторые проблемы, и я также не могу найти много в Интернете.
public partial class...
866 просмотров
schedule
18.04.2024
Петля обратной связи распознавания речи
Я работаю над системой распознавания речи, чтобы разговаривать с моим компьютером. Теперь у меня компьютерный аудиовыход настроен на систему объемного звука. Это вызвало проблемы для системы распознавания. Например, когда я говорю «тест», чтобы...
812 просмотров
schedule
03.05.2024
CTC: В чем разница между пробелом и пробелом?
В статье 2006 года о временной классификации коннекционистов Алекс Грейвс и др. представила модель декодирования речи с 27 метками: 26 для букв алфавита и одна для пробела , что означает отсутствие метки (что я понимаю как молчание ).
Тем не...
972 просмотров
schedule
06.03.2024