Google представила новую модель искусственного интеллекта Gemini, которая считается самой крупной и мощной моделью компании, сообщает New Atlas.

Gemini имеет три оптимизированные версии — Ultra, Pro и Nano — для использования в разных целях: от центров обработки данных до мобильных устройств.

Самая мощная версия, Gemini Ultra, обладает выдающейся производительностью, превосходящей текущих лидеров в области ИИ в 30 из 32 академических тестах по большим языковым моделям (LLM). Её оценка 90% в тесте MMLU (понимание языка в условиях многозадачности) делает Ultra первой моделью, превзошедшей экспертов-людей в данной области (89,8%), а также GPT-4 (86,4%).

Google заявляет, что Gemini превосходит GPT-4 OpenAI и экспертов-людей почти во всех важных тестах. Модель обладает мультимодальностью, что означает способность понимания текста, изображений, видео, аудио, а также кода. Она была обучена на обширном наборе данных, включающем различные типы медиа, что позволяет ей эффективно понимать разнообразные источники информации.

В ходе демонстрации разработчики показали, как Gemini генерирует собственный код для чтения и интерпретации 200 000 научных исследований, фильтруя их по релевантности, используя свои собственные возможности рассуждения, а затем сопоставлять данные и эффективно создавать новые метазнания.

Gemini попадет в открытый доступ 13 декабря через API, а в начале 2024 года она появится в Bard Advanced.