Корпорация Apple представила новые ИИ-модели, которые получили общее название OpenELM. Открытая модель обучена на общедоступных данных и на пару процентов точнее февральской модели OLMo.

Нейросеть отличается от конкурентов небольшим количеством используемых в предварительном обучении токенов. Еще одной ключевой особенностью ИИ-модели является предоставление Apple полного набора инструментов для обучения и оценки OpenELM.

Ранее корпорация выпускала в открытый доступ лишь вес модели и код для инференции. Решение предоставить больше данных должно показать, что компания готова к открытости и ничего не скрывает от пользователей.

Источник: https://www.securitylab.ru/

ИИ-модель создана на необычной технике, которая называется масштабированием слоев. Такой подход позволяет эффективно распределять параметры в модели трансформера и обеспечивать повышенную точность ответов нейросети.

В обучении использовали данные с таких источников, как GitHub, Википедия, StackExchangе и др. В результате тестов нейросеть показала не только повышенную точность, но и сниженную производительность в сравнении с предыдущими моделями. По мнению исследователей, это связано с использованием неоптимизированного алгоритма RMSNorm.

Ранее издание опубликовало статью о том, что компания Throwflame открыла продажи робота-собаки, на спине которой пасположили работающий огнемет.