USD
98.06
-0.48
EUR
102.92
+0.24
Категория: ЭлектромобилиЭлектромобили
7 июня 2023 г. в 16:57

Ученые усовершенствовали компьютерное зрение беспилотных автомобилей и кибернетических аватаров

Ученые усовершенствовали компьютерное зрение беспилотных автомобилей и кибернетических аватаров
cloud.yandex.ru
Исследователи из RIKEN продемонстрировали, что небольшая настройка алгоритмов, обычно применяемых для улучшения изображений, может существенно улучшить возможности распознавания компьютерного зрения в различных приложениях, включая беспилотные автомобили и кибернетические аватары.
Линь Гу, участник проекта RIKEN Center for Advanced Intelligence, в отличие от многих экспертов в области искусственного интеллекта (ИИ), начал свою карьеру в качестве терапевта. Этот опыт дал ему уникальное понимание проблемы масштабирования, которая является критической для компьютерного зрения и связана с трудностью точного обнаружения объектов в различных масштабах на изображениях. Поскольку большинство систем искусственного интеллекта обучаются высокоразрешенным изображениям, проблемы возникают при работе с нереалистичными изображениями низкого качества, на которых присутствуют размытости или искажения, что затрудняет работу алгоритмов распознавания.
"Человеческое зрение имеет постоянство размера, что означает, что мы воспринимаем объекты одинакового размера, несмотря на то, как меняется изображение сетчатки", - говорит Гу. "Напротив, существующим алгоритмам компьютерного зрения не хватает такого постоянства”
Вдохновленные методами воспроизведения гиппокампа, которые мозг использует для формирования воспоминаний, Линь Гу и его коллеги разработали модель, которая случайным образом ухудшает разрешение, добавляет размытость и шум к изображению высокого разрешения, и в то же время ищет функции, которые остаются неизменными после множественных изменений. Их исследование было опубликовано в Computer Vision - ECCV 2022.
Алгоритм обучается на сгенерированных данных, и в результате он может самостоятельно обучаться, помогая другим алгоритмам обработки изображений определить объекты на изображении и их местоположение без человеческого вмешательства. Это приводит к более эффективному методу кодирования и восстановления важных деталей на изображении с вычислительной точки зрения.
"В типичных методах обучения с самообслуживанием данные обучения изменяются либо путем маскировки части изображения, либо путем изменения контраста перед изучением надзорного сигнала", - объясняет Гу. "Мы предлагаем впервые использовать разрешение в качестве подсказки для самоконтроля".
В дополнение к типичным применениям компьютерного зрения, Линь Гу отмечает, что постоянное представление восприятия будет иметь фундаментальное значение для технологий, связанных с киборгами и аватарами. Он приводит пример своего участия в футуристическом проекте японских научных агентств, направленном на создание реалистичной цифровой версии правительственного министра, способной взаимодействовать с гражданами.
"Для механизма искусственной памяти представления, которые инвариантны изменениям разрешения, могут выступать в качестве краеугольного камня", - говорит Гу. "Я работаю с нейробиологами в RIKEN, чтобы исследовать связь между искусственным вечным постоянным представлением и реальным в мозге".
Этот метод также применяется к терагерцовой визуализации - новой неразрушающей визуализации с большим потенциалом в биомедицине, безопасности и характеристике материалов. Информация об этом размещена в журнале Tech Xplore.
0 комментариев