Skip to content
kramarov-evg edited this page Aug 8, 2019 · 5 revisions

Детектирование людей на кадре методами классического компьютерного зрения

Описание

Задача детектирования объектов заключается в анализе изображения и предоставлении данных о найденных объектах в виде списка структур, содержащих в себе координату начала объекта на кадре, его ширину и длину в пикселях (x, y, w, h). В данном репозитории будут рассмотренны три варианта решения данной задачи путём использования классических алгоритмов компьютерного зрения.

Требования к задаче

Цель работы заключается в оценке качества существующих решений и подборе оптимальных параметров.

Каждый из методов должен быть реализован в виде функции или функтора, принимающего обязательный аргумент в виде изображения и, при необходимости, другие параметры, имеющие при этом значение по умолчанию. Изображение подаётся в виде матрицы (cv::Mat в случае C++ и np.ndarray в случае Python) в формате BGR.

Функция/функтор должен возвращать итерируемый объект со структурой, имеющей открытые поля x, y, w, h, описывающие прямоугольник, внутри которого располагается объект.

x - абсцисса левого верхнего угла объекта на изображении y - ордината левого верхнего угла объекта на изображении w - ширина прямоугольника h - высота прямоугольника

Все величины приведены в пикселях.

Методы

  • Каскады Хаара
  • Hog features + classifier
  • Bag of features