-
Notifications
You must be signed in to change notification settings - Fork 4
Home
Задача детектирования объектов заключается в анализе изображения и предоставлении данных о найденных объектах в виде списка структур, содержащих в себе координату начала объекта на кадре, его ширину и длину в пикселях (x, y, w, h). В данном репозитории будут рассмотренны три варианта решения данной задачи путём использования классических алгоритмов компьютерного зрения.
Цель работы заключается в оценке качества существующих решений и подборе оптимальных параметров.
Каждый из методов должен быть реализован в виде функции или функтора, принимающего обязательный аргумент в виде изображения и, при необходимости, другие параметры, имеющие при этом значение по умолчанию. Изображение подаётся в виде матрицы (cv::Mat в случае C++ и np.ndarray в случае Python) в формате BGR.
Функция/функтор должен возвращать итерируемый объект со структурой, имеющей открытые поля x, y, w, h, описывающие прямоугольник, внутри которого располагается объект.
x - абсцисса левого верхнего угла объекта на изображении y - ордината левого верхнего угла объекта на изображении w - ширина прямоугольника h - высота прямоугольника
Все величины приведены в пикселях.
- Каскады Хаара
- Hog features + classifier
- Bag of features