Новая технология от «Майкрософт»: мгновенный перевод речи вашим голосом

12 ноября 2012 года

Компания «Майкрософт» представила программу, которая может практически мгновенно переводить устную речь с передачей особенностей голоса говорящего. В результате создается впечатление, что человек сам говорит на иностранном языке.

Принцип работы следующий: система распознает речь, преобразует ее в текст на языке перевода и озвучивает, воспроизводя голос говорящего. Чтобы программа могла воспроизводить голос говорящего, ей требуется около часа обучения. Система распознавания речи базируется на технологии нейронных сетей. Программа неправильно распознает лишь одно из 7-8 слов, тогда как ранее каждое четвертое-пятое слово распознавалось неверно.

Ранее «Майкрософт» уже представила технологию, которая позволяет воспроизводить особенности голоса человека. Однако эта технология позволяла произносить только печатный текст.

«Майкрософт» – не единственная компания, которая занимается исследованиями в области распознавания речи. Недавно корпорация Google начала использовать собственную технологию на основе нейронных сетей в приложениях для распознавания голоса и некоторых сервисах. Также компания AT&T представила систему перевода в режиме реального времени для испанского и английского. Однако прототипы, созданные этими компаниями, не обладают способностью передавать особенности голоса человека.

Пока неизвестно, будет ли продукт запущен в серийное производство. Вероятно, это связано с тем, что технология еще не доведена до совершенства: возможно, в перспективе распознавание слов станет еще более точным.

Назад

Услуги для вас

Узнать больше