Стартап Vals.ai разрабатывает систему оценки эффективности ИИ-моделей

Американский молодой стартап Vals.ai занимается созданием универсальной системы, которая будет оценивать эффективность моделей искусственного интеллекта.

Новые продукты на базе ИИ выходят каждый месяц, и все они, со слов производителей, превосходят друг друга по качеству. Молодые специалисты решили создать независимый стандартизированный тест, благодаря которому компании или пользователи смогут дать реальную оценку каждому продукту.

Основателями компании Vals.ai стали молодые ребята Райан Кришнан и Лэнгстон Нэшолд, которые ранее изучали в Стэнфорде искусственный интеллект. Для обучения своей модели по оценке ИИ-инструментов исследователи использовали академические и отраслевые наборы данных.

Создатели Vals.ai - Райан Кришнан и Лэнгстон Нэшолд. Фото: https://www.bloomberg.com/

Продукт был официально презентован вчера, 11 апреля. В тот же день представители стартапа сообщили, что им удалось привлечь финансирование от компании Pear VC, при этом не раскрывая суммы вложений.

Vals.ai уже провел несколько исследований и опубликовал первые отчеты, в которых указал на недостатки ИИ-моделей. В рамках исследования стало известно, что GPT-4 от OpenAI имеет показатель точности 54,5%, Gemini Pro от Google точна только в 31,3% случаев при решении налоговых вопросов.

Ранее издание involta.media опубликовала статью о том, что стартап Spare Parts 3D разработал ПО для преобразования чертежей в 3D-модели.

0 комментариев