Microsoft разрабатывает искусственный интеллект, который клонирует голос говорящего

Microsoft разрабатывает искусственный интеллект, который клонирует голос говорящего
Читайте нас: Дзен новости

Источники: | www.topnews.ru

Новый инструмент VALL-E от Microsoft способен клонировать голос человека из 3-секундного аудиоклипа и озвучивать им целые тексты с нуля.
Microsoft разрабатывает искусственный интеллект, который клонирует голос говорящего
Автор:
involta technologies
involta technologies

Новый инструмент VALL-E от Microsoft способен клонировать голос человека из 3-секундного аудиоклипа и озвучивать им целые тексты с нуля.

Компания планирует инвестировать 10 миллиардов долларов в ChatGPT, а также разрабатывает новую нейросеть, сообщает издание Insider. VALL-E обучен на шестидесяти тысячах часов английской речи и может запрограммировать голос произносить слова, которые он никогда ранее не слышал. Для высококачественного персонализированного воспроизведения написанных текстов новая нейросеть использует технологию преобразования текста в речь.

Для проведения выборки использовались аудиозаписи более 7000 реальных ораторов из LibriLight — набора данных аудиокниг, состоящего из общедоступных текстов, записанных добровольцами. Компания Microsoft пока не открыла инструмент для публичного использования, но исследователи сайта arXiv заявили, что результаты работы VALL-E значительно превосходят самые передовые системы в своем роде с точки зрения естественности речи и сходства говорящих, несмотря на то, что у голосов пока отсутствует разнообразие акцентов.

Вопрос этичного использования VALL-E вызывает беспокойство у экспертов. Опасение вызывает тот факт, что инструмент может быть использован не по назначению, например, для подмены голосовой идентификации или выдачи себя за определенного человека. Разработчики отмечают, что необходимо создать инструмент, который сможет идентифицировать органические и синтезированные аудиозаписи, также модель должна включать протокол, гарантирующий, что говорящий одобряет использование своего голоса.

Наверх