Специалисты Google Brain, лаборатории искусственного интеллекта, представили новый проект — Imagen Video. В его функционал входит создание видеоклипов из текстовых подсказок.

Это уже не первая разработка в области искусственного интеллекта для преобразования текста в изображение или видео, сообщает портал Gadgetsnow.

Imagen Video от Google умеет монтировать видеоклипы с разрешением 1280x768 пикселей и скоростью 24 кадра в секунду. Только длительность такого видеоряда не превышает 5,3 секунды. Генерация 16-кадрового видеоролика происходит на основе текстового описания. После этого искусственный интеллект масштабирует кадры и предугадывает дополнительный видеоряд на основе текста.

«Мы находим Imagen Video не только способным создавать видео высокой точности, но также обладающим высокой степенью управляемости и знанием мира, включая способность создавать разнообразные видео и текстовую анимацию в различных художественных стилях и с пониманием 3D-объектов», — сообщают исследователи из Google.

Обучение Imagen Video происходило на основе большой базы данных из 14 миллионов видео и 60 миллионов статичных картинок. Создатели Imagen Video рассчитывают расширить свои возможности при помощи тесного сотрудничества с разработчиками Phenaki — искусственного интеллекта, обученного преобразовывать текст в видео с менее высоким качеством, но протяжённостью до двух минут.