Меню Закрыть

Новая система компьютерного зрения в 4 раза быстрее предыдущих моделей

Новая система компьютерного зрения в 4 раза быстрее предыдущих моделей

Недавно разработанная система компьютерного зрения, которая распознает движение быстрее, чем человек, может сделать беспилотные автомобили, роботов и другие автономные системы более безопасными и отзывчивыми.

Концептуальная иллюстрация автономного беспилотного автомобиля, распознающего дорожные знаки. Источник: vchal / iStock / Getty Images Plus

Система описана в исследовании, опубликованном в журнале Nature.

Системы компьютерного зрения основаны на методе оптического потока, при котором отслеживается движение объектов, поверхностей и границ в сцене как относительно наблюдателя, так и относительно других объектов в сцене.

Алгоритмы делают это на уровне пикселей, чтобы оценить трехмерную структуру и движение, но основная идея основана на биологическом зрении животных.

«Однако современные алгоритмы, несмотря на то, что справляются с задачами на уровне человека при работе с эталонными наборами данных, страдают от значительных временных задержек, что ограничивает их практическое применение», — пишут авторы.

«Оптический поток изначально создавался для имитации процесса обработки информации в биологических зрительных системах, но на практике не может в точности воспроизвести их высокую эффективность обработки. Это связано с тем, что биологическое зрение превосходно справляется с эффективной обработкой больших объемов визуальной информации за счет динамической фокусировки на движущихся объектах», — объясняют они.

Новая система решает эти проблемы, имитируя взаимодействие между сетчаткой и латеральным коленчатым телом (ЛКТ) биологического глаза.

Сетчатка — это светочувствительная ткань в задней части глаза, которая преобразует сфокусированный свет в электрические сигналы. Латеральный геномный комплекс получает эту информацию от сетчатки, а затем передает ее в первичную зрительную кору головного мозга, которая обрабатывает данные о форме, цвете и движении.

Латеральный генунгальный комплекс — это не просто передатчик, он взаимодействует с мозгом, указывая глазу, на чем следует сосредоточить внимание.

Аналогичным образом система компьютерного зрения начинает работу с изменения яркости, которое кодируется в аналоговом формате для выделения областей интереса (ROI). «Затем эти области интереса используются в качестве входных данных для традиционных алгоритмов оптического потока и машинного зрения, что позволяет проводить сверхбыстрый анализ движения», — говорят авторы.

Исследователи протестировали систему в различных сценариях, в том числе с участием беспилотных автомобилей, беспилотных летательных аппаратов и роботов-манипуляторов.

«По сравнению с самыми современными алгоритмами наш подход демонстрирует ускорение на 400 %, превосходя по производительности человеческий уровень и сохраняя или повышая точность за счет учета временных факторов», — добавляют они.

«Наш пространственно-временной интегрированный подход, способный повысить эффективность в широком спектре областей применения, может стать основой для более широкого внедрения в таких сферах, как робототехника, автономные системы и компьютерное зрение, способствуя революционным достижениям».



Больше на COSMOFACT

Подпишитесь, чтобы получать последние записи по электронной почте.

Опубликовано в ИНЖЕНЕРИЯ

ЧИТАЙТЕ ТАК ЖЕ

error: Content is protected !!