OpenAI представила нейросеть для клонирования голоса

Техногигант OpenAI анонсировал запуск своей новой нейросети, которая получила название Voice Engine. ИИ-модель способна клонировать голос любого пользователя, для этого необходима лишь 15-секундная запись речи.

Voice Engine точно имитирует голос пользователя. Данной нейросетью уже пользуется несколько компаний, в числе которых Age of Learning - американский сервис, который разрабатывает онлайн-программы обучения для детей, а также HeyGen и Dimagi.

Компании используют ИИ-модель для трансляции контента, текст для которой пишет GPT-4 и озвучивается голосом лектора.

В OpenAI рассказали, как еще можно использовать Voice Engine:

- для перевода контента. ИИ-модель способна переводить видеозаписи и подкасты на несколько языков, при этом сохраняя голос и акцент диктора, сохраняя его индивидуальность.

- для помощи глухонемым людям. Нейросеть позволит глухонемым людям получить свой "голос", который не будет звучать роботизированно.

- для восстановления голоса пациентов. Voice Engine уже используется в Институте нейронаук Нормана Принса для помощи пациентам, которые потеряли голос. Нейросеть воссоздает их речь при помощи короткой аудиозаписи.

Кроме того, нейросеть может быть интегрирована в приложения и устройства пользователей. Таким образом любой человек сможет переводить свою речь на другие языки, создавая видео, а также менять языки озвучки сериалов, сохраняя истинный голос актеров.

Ранее издание involta.media опубликовало статью о том, что компания Adobe представила генеративную нейросеть GenStudio.

0 комментариев