Stability AI опубликовала модель Stable Audio для генерации музыки

ИИ-стартап Stability AI выложил в открытый доступ модель Stable Audio, которая предназначена для генерации музыки и звуковых эффектов. Ознакомиться с моделью и ее характеристиками можно на платформе Hugging Face.

ИИ-модель в формате Text-to-Audio способна генерировать музыкальные семплы длиной до 47 секунд. Благодаря текстовому запросу пользователь может уточнить запрос или добавить детали. Отметим, что нейросеть способна генерировать звуки любых музыкальных инструментов, а также шум дождя, пение птиц и многое другое.

Начинающие музыканты могут использовать ИИ-модель для улучшения своих композиций - генерировать треки можно на основе загруженных данных.

Открытая модель получила одно важное отличие от закрытой Stable Audio - это длина готовой записи. В закрытой платной версии пользователь сможет создавать аудиозаписи длиной до трех минут, также нейросеть имеет больше возможностей для проработки структуры трека.

Stable Audio Open была обучена на данных, размещенных на сервисах FreeSound и Free Music Archive, поэтому авторские права ни одного исполнителя не были нарушены. Несмотря на это, каждый пользователь перед стартом обязан ознакомиться с лицензией использования.

Ранее издание involta.media опубликовало статью о том, что Илон Маск использует тысячи ИИ-чипов Nvidia для развития соцсети Х и стартапа xAI.

0 комментариев