Переводчик говорит по-китайски своим голосом

Компьютеризированный машинный перевод никогда не был реальным, что бы вы могли использовать для перевода речи со 100-процентной уверенностью и близкой к производительности в режиме реального времени. Однако технологии продвигаются быстро, и некоторые из основных игроков рынка уже предлагают решения для перевода речи, которые также включают в себя реалистичные решения для синтеза речи человека.

И, фактически, эти технологии синтеза речи становятся настолько продвинутыми, что не проблема имитировать собственный голос. «Microsoft Research» просто продемонстрировал такой инструмент с возможностью перевода разговорного языка на один из китайских диалектов:

Переводчик говорит по-китайски своим голосом

Рашид произнес только восемь английских предложений в новую систему распознавания речи, перевода и генерации лаборатории, но компания сообщает, что выпуск мандарина поразил толпу 2000 учеников и ученых (переход на 7:30 в видео выше, чтобы услышать выход).

Передовые возможности системы проистекают из метели улучшений на всех этапах процесса речевой речи. Программное обеспечение, такое как Nuance’s Dragon Naturally Speaking, спокойно проложило путь для распознавания речи в офисах – и теперь продукты на его основе, такие как помощник iPhone от Siri iPhone, могут распознавать разговорные вопросы и искать ответы в Интернете. У Microsoft Kinect также есть интерфейс для речевого интерфейса.

Хотя такие системы часто ошибаются – как правило, заблуждаются по одному из каждых четырех или пяти слов, говорит Рашид, – теперь у них есть лучший способ узнать, что говорят люди. Подход Microsoft заключается в использовании новой системы нейронных сетей (машинного обучения), которая уменьшает ошибки распознавания слов до одного из семи или восьми. Это означает, что механизм перевода, Bing Translate, имеет гораздо больший шанс создать понятный текст мандарина для подачи в говорящий движок.