Новая система компьютерного зрения в 4 раза быстрее предыдущих моделей
Недавно разработанная система компьютерного зрения, которая распознает движение быстрее, чем человек, может сделать беспилотные автомобили, роботов и другие автономные системы более безопасными и отзывчивыми.

Система описана в исследовании, опубликованном в журнале Nature.
Системы компьютерного зрения основаны на методе оптического потока, при котором отслеживается движение объектов, поверхностей и границ в сцене как относительно наблюдателя, так и относительно других объектов в сцене.
Алгоритмы делают это на уровне пикселей, чтобы оценить трехмерную структуру и движение, но основная идея основана на биологическом зрении животных.
«Однако современные алгоритмы, несмотря на то, что справляются с задачами на уровне человека при работе с эталонными наборами данных, страдают от значительных временных задержек, что ограничивает их практическое применение», — пишут авторы.
«Оптический поток изначально создавался для имитации процесса обработки информации в биологических зрительных системах, но на практике не может в точности воспроизвести их высокую эффективность обработки. Это связано с тем, что биологическое зрение превосходно справляется с эффективной обработкой больших объемов визуальной информации за счет динамической фокусировки на движущихся объектах», — объясняют они.
Новая система решает эти проблемы, имитируя взаимодействие между сетчаткой и латеральным коленчатым телом (ЛКТ) биологического глаза.
Сетчатка — это светочувствительная ткань в задней части глаза, которая преобразует сфокусированный свет в электрические сигналы. Латеральный геномный комплекс получает эту информацию от сетчатки, а затем передает ее в первичную зрительную кору головного мозга, которая обрабатывает данные о форме, цвете и движении.
Латеральный генунгальный комплекс — это не просто передатчик, он взаимодействует с мозгом, указывая глазу, на чем следует сосредоточить внимание.
Аналогичным образом система компьютерного зрения начинает работу с изменения яркости, которое кодируется в аналоговом формате для выделения областей интереса (ROI). «Затем эти области интереса используются в качестве входных данных для традиционных алгоритмов оптического потока и машинного зрения, что позволяет проводить сверхбыстрый анализ движения», — говорят авторы.
Исследователи протестировали систему в различных сценариях, в том числе с участием беспилотных автомобилей, беспилотных летательных аппаратов и роботов-манипуляторов.
«По сравнению с самыми современными алгоритмами наш подход демонстрирует ускорение на 400 %, превосходя по производительности человеческий уровень и сохраняя или повышая точность за счет учета временных факторов», — добавляют они.
«Наш пространственно-временной интегрированный подход, способный повысить эффективность в широком спектре областей применения, может стать основой для более широкого внедрения в таких сферах, как робототехника, автономные системы и компьютерное зрение, способствуя революционным достижениям».
Больше на COSMOFACT
Подпишитесь, чтобы получать последние записи по электронной почте.