USD
98.01
-0.01
EUR
102.78
+0.37
Категория: AI и робототехникаAI и робототехника
30 января 2025 г. в 18:41

Модель Tulu3-405B от Ai2 обходит DeepSeek и GPT-4o по ключевым тестам

Модель Tulu3-405B от Ai2 обходит DeepSeek и GPT-4o по ключевым тестам
Getty Images
В Сиэтле исследовательский институт Ai2 анонсировал новую модель ИИ Tulu3-405B, которая, по утверждениям разработчиков, превосходит китайскую систему DeepSeek V3 и GPT-4o от OpenAI по ряду показателей.
Tulu3-405B обладает открытым исходным кодом, что позволяет бесплатно использовать все её компоненты. Модель включает 405 миллиардов параметров, для её обучения использовались 256 графических процессоров.
По данным Ai2, Tulu3-405B продемонстрировала лучшие результаты в тестах PopQA и GSM8K, превосходя DeepSeek V3, GPT-4o и Meta* Llama 3.1. Модель использует метод обучения с подкреплением (RLVR), что позволяет ей эффективно решать задачи с проверяемыми результатами, например, математические задачи. Код модели доступен на GitHub и Hugging Face для разработчиков.
Ранее издание involta.media опубликовало статью о том, что новые модели Polestar Arctic Circle дебютируют на ледовых гонках в Австрии.
* Meta - признана экстремистской и запрещена на территории РФ.
0 комментариев