[audio] Как преобразовать речь в текст?


Answers

.NET может сделать это с помощью пространства имен System.Speech.

Вам нужно будет сначала преобразовать в .wav или захватить звук в реальном времени с микрофона.

Подробности о реализации можно найти здесь: Transcribing Audio с .NET

Question

Как я могу взять MP3 и преобразовать речь в текст?

У меня есть записанные заметки на конференции и на собраниях (на записи есть один голос, это мой голос). Я думал, что было бы проще и интеллектуально интересно преобразовать текст, используя речь в текстовые инструменты, а не просто расшифровывать вручную. Я знаю, что есть технологии, особенно для приложений VoIP, использующих Asterisk и Podcasts, но каковы они и как я могу их использовать?




Поздно к вечеринке, так что ответим больше на будущие ссылки.

Достижения в области + мышление и повестка дня Mozilla привели к этим двум проектам в этом направлении:

У последнего есть 12-гигабайтный набор данных для загрузки. Первый позволяет обучать модель с вашими собственными аудиофайлами для моего понимания






Related