USD
106.19
-0.99
EUR
112.02
-0.78
Категория: Наука и технологииНаука и технологии
20 января 2023 г. в 11:26

Microsoft разрабатывает искусственный интеллект, который клонирует голос говорящего

Microsoft разрабатывает искусственный интеллект, который клонирует голос говорящего
www.topnews.ru
Новый инструмент VALL-E от Microsoft способен клонировать голос человека из 3-секундного аудиоклипа и озвучивать им целые тексты с нуля.
Компания планирует инвестировать 10 миллиардов долларов в ChatGPT, а также разрабатывает новую нейросеть, сообщает издание Insider. VALL-E обучен на шестидесяти тысячах часов английской речи и может запрограммировать голос произносить слова, которые он никогда ранее не слышал. Для высококачественного персонализированного воспроизведения написанных текстов новая нейросеть использует технологию преобразования текста в речь.
Для проведения выборки использовались аудиозаписи более 7000 реальных ораторов из LibriLight — набора данных аудиокниг, состоящего из общедоступных текстов, записанных добровольцами. Компания Microsoft пока не открыла инструмент для публичного использования, но исследователи сайта arXiv заявили, что результаты работы VALL-E значительно превосходят самые передовые системы в своем роде с точки зрения естественности речи и сходства говорящих, несмотря на то, что у голосов пока отсутствует разнообразие акцентов.
Вопрос этичного использования VALL-E вызывает беспокойство у экспертов. Опасение вызывает тот факт, что инструмент может быть использован не по назначению, например, для подмены голосовой идентификации или выдачи себя за определенного человека. Разработчики отмечают, что необходимо создать инструмент, который сможет идентифицировать органические и синтезированные аудиозаписи, также модель должна включать протокол, гарантирующий, что говорящий одобряет использование своего голоса.
0 комментариев