Разработчики Джошуа Сюем и Уэйн Лян представили нейросеть, которая предназначена для оптимизации процесса создания видео с помощью искусственного интеллекта.

Стоит отметить, что нейросеть не является новой. Heygen - это улучшенная версия ИИ-модели Movio, которая была создана в 2020 году. В результате ребрендинга нейросеть получила расширенный функционал и встроенный ChatGPT.

В основе Heygen лежат генеративно-состязательные сети, которые состоят из генератора и дискриминатора. Генератор отвечает за создание видео, приближенных к оригиналу, а дискриминатор сравнивает созданные ролики с реальными, постепенно улучшая результаты.

Добавим, что нейросеть предлагает множество настроек, в числе которых различные визуальные стили, цветовые палитры, возможность наложения текста и анимации.

Фото: timeai.ru

Для создания ролика пользователи могут использовать цифровые аватары из библиотеки приложения, а также разработать собственный уникальный прототип. Далее модель искусственного интеллекта копирует тембр голоса пользователя, используя его для генерации речи в новом видео.

Отметим, что на платформе можно преобразовать текст в речь на 40 разных языках. Это позволяет наладить мультиязычную коммуникацию.

HeyGen позволяет ускорить процесс создания профессиональных видео для обучения сотрудников или клиентов, проведения виртуальных мероприятий, запуска продуктов и других целей. Основной задачей модели является разработка видеоматериалов высокого качества в краткие сроки.

Ранее мы сообщали, что Alibaba выпустила нейросеть, анимирующую фото людей.