Как сообщили «proIT» в компании, программа может изучить голос человека, а потом использовать его для перевода и воспроизведения целых предложений на другом языке. Таких языков уже 26.
Разработка была представлена в начале марта в Редмонде, штат Вашингтон. Тогда исследователь из Microsoft Фрэнк Сунг (Frank Soong) продемонстрировал способность своего творения читать текст на испанском голосом его начальника Рика Рашида (Rick Rashid), возглавляющего исследовательские проекты Microsoft. В следующем примере директор по исследованиям и стратегии корпорации Microsoft Крейг Манди (Craig Mundie) получил возможность заговорить на китайском.
Чтобы система смогла разработать модель речи человека, ей понадобится около часа тренировок. Индивидуальное звучание человека анализируется, раскладывается на звуки и накладывается на стандартный синтезатор речи, заставляя таким образом программное обеспечение воспроизводить речь человека на другом языке.
Фрэнк Сунг, работавший над новой технологией вместе со своими коллегами из Microsoft Research Asia в Китае, заявил, что ее можно использовать для целого ряда полезных приложений.
«Для человека, который путешествует по зарубежной стране и знает только один язык, мы создадим приложение для распознавания речи с последующим переводом и воспроизведением уже на иностранном языке, но все еще голосом того самого туриста», – обещает он.
Сунг также показал, насколько новая система может улучшить навигационное приложение для телефона, позволяя ему плавно зачитывать текст, написанный на китайских дорожных знаках по пути в Пекин. По его словам, новую технологию смогут использовать и студенты, которые изучают иностранный язык: фразы на другом языке, произнесенные собственным голосом, легче имитировать.