USD
72.56
+1.01
EUR
84.61
-1.64
Категория: AI и робототехникаAI и робототехника
2 июня 2026 г. в 23:35

Microsoft представила инструмент для тестирования ИИ систем ASSERT

Microsoft представила инструмент для тестирования ИИ систем ASSERT
techcrunch.com
Microsoft представила фреймворк ASSERT (Adaptive Spec-driven Scoring) — инструмент с открытым исходным кодом для оценки и регрессионного тестирования ИИ-систем.
Он призван помочь разработчикам проверять, насколько поведение моделей соответствует задачам конкретного продукта или сервиса. В отличие от общих бенчмарков, ASSERT ориентирован на прикладные сценарии. Система преобразует текстовые описания требований и политик в структурированные критерии допустимого и недопустимого поведения, а затем автоматически генерирует тестовые кейсы и сценарии для проверки модели.
Фреймворк может запускать тесты против ИИ-систем, фиксировать их действия, включая промежуточные шаги и вызовы инструментов, и анализировать результаты. Это позволяет выявлять сбои в логике работы и несоответствия заданным правилам.
Разработчики могут дополнительно задавать контекст, ограничения и доступные инструменты, чтобы точнее моделировать реальные условия использования. ASSERT также может применяться на разных этапах — от разработки до пострелизного мониторинга.
0 комментариев