USD
77.17
-0.10
EUR
90.73
-0.57
Категория: AI и робототехникаAI и робототехника
2 марта 2026 г. в 09:40

Новый экзамен выявил ограничения современных систем ИИ

Новый экзамен выявил ограничения современных систем ИИ
Neuroscience News
Международная группа почти из 1 000 ученых и специалистов представила новый экзамен для оценки возможностей искусственного интеллекта под названием Humanity’s Last Exam.
В тест включены 2 500 вопросов повышенной сложности по математике, а также естественным и гуманитарным наукам. Задания сформированы так, чтобы исключить поиск готовых ответов в открытых источниках и применение шаблонных решений. На этапе подготовки авторы удаляли все вопросы, с которыми модели уже справлялись.
В первых испытаниях GPT-4o набрал 2,7%, Claude 3.5 Sonnet справился на 4,1%, модель o1 показала результат в 8%. Даже более новые системы демонстрируют лишь 40–50% правильных ответов. Разработчики считают тест инструментом для точной оценки реального уровня ИИ и выявления его ограничений.
0 комментариев