Дослідження методів та засобів ідентифікації об’єктів на відеозображеннях

Автор: Шургот Степан Володимирович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні системи та мережі
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2020-2021 н.р.
Мова захисту: українська
Анотація: Задача розпізнавання образів — це задача віднесення вихідних даних до певного класу за допомогою виділення істотних ознак, що характеризують ці дані, із загальної маси несуттєвих даних. Розпізнавання образів є однією з найфундаментальніших проблем теорії інтелектуальних систем. З іншого боку, задача розпізнавання образів має величезне практичне значення [2]. В роботі проведено розробку системи оптичного розпізнавання образів – це технологія автоматичного встановлення відповідності об’єкта спостережуваного системою комп’ютерного зору до певного класу уже заздалегідь відомих об’єктів. Головними складнощами у реалізації такої системи є ідентифікація об’єктів які мають певну геометричну форму у просторі, оскільки при проекції цього об’єкта на камеру ми отримаємо 2D фігуру і під різними кутами спостереження об’єкт спостереження буде мати різні форми, що сильно ускладнює роботу системи. Частково цю проблему можна вирішити взявши множину камер, які будуть спостерігати за об’єктом під різними кутами [3]. Розглянувши існуючі методи розпізнавання об’єктів на відеозобрженні, можна зробити висновок що алгоритм гістограми напрямлених градієнтів (HOG) з використанням методу опорних векторів (SVM) дозволяє отримувати достатньо хороші результати ідентифікації. Гістограма напрямлених градієнтів[1] — дескриптор ознак, який використовується в комп’ютерному зорі і обробці зображень з метою розпізнання об’єктів. Метод підраховує напрямки градієнтів в локальних точках зображення. Він близький до гістограми орієнтованих границь, та значення форми, але відрізняється тим, що обраховується в щільній сітці рівномірно розташованих клітин та для підвищення точності використовує локальну нормалізацію контрасту. В машинному навчанні метод опорних векторів — це метод аналізу даних для класифікації та регресійного аналізу за допомогою моделей з керованим навчанням з пов’язаними алгоритмами навчання, які називаються опорно-векторними машинами . Для заданого набору тренувальних зразків, кожен із яких відмічено як належний до однієї чи іншої з двох категорій, алгоритм тренування ОВМ (опорно-векторні мережі) будує модель, яка відносить нові зразки до однієї чи іншої категорії, роблячи це неймовірнісним бінарним лінійним класифікатором. Модель ОВМ є представленням зразків як точок у просторі, відображених таким чином, що зразки з окремих категорій розділено чистою прогалиною, яка є щонайширшою [4]. Нові зразки тоді відображуються до цього ж простору, й робиться передбачення про їхню належність до категорії на основі того, на який бік прогалини вони потрапляють. Для більшої наочності в роботі наведено блок- схему роботи алгоритму гістограми напрямлених градієнтів. Також в роботі наведено структурну схему системи для розпізнавання, яка включає в себе дві основні частини: клієнтську і серверну, це зумовлено тим, що обробка зображення вибраним алгоритмом потребує великих апаратних потужностей, які на стороні клієнта розміщати буде дуже складно та фінансово не вигідно. Для програмної реалізації ПЗ було також наведено блок-схему роботи та проведено дослідження ефективності алгоритму HOG в розпізнаванні різних транспортних засобів з допомогою спеціально навчених SVM-класифікаторів, дослідження було проведено х допомогою середовища MATLAB. Для системи було вибрано основні вузли, такі як робоча станція, платформа клієнта та відеокамера. В якості платформи клієнта був вибраний мікрокомп’ютер Raspberry Pi, який надає системі велику модульність та дозволяє використовувати спеціалізований інтерфейс CSI, що використовуються для високошвидкісної передачі відеозображень. Для демонстрації системи було нарисовано UML-діаграму для розробленої системи на якій виділено основні її функції та принцип роботи. Об’єкт дослідження – методи розпізнавання об’єктів інтересу на відеозображенні. Предмет дослідження – ефективність використання тих чи інших методів розпізнавання. Мета дослідження: вибрати найбільш підходящий алгоритм проведення ідентифікації та побудувати систему яка дозволить проводити розпізнавання певних об’єктів. Ключові слова – гістограма напрямлених градієнтів, метод опорних векторів, розпізнавання об’єктів, обробка зображення, алгоритм розпізнавання образів. Перелік використаних літературних джерел. 1. Navneet Dalal, Bill Triggs. Histograms of Oriented Gradients for Human Detection. International Conference on Computer Vision & Pattern Recognition (CVPR ’05), Jun 2005, San Diego, United States. pp.886–893, 10.1109/CVPR.2005.177. inria-00548512 2. Файн В.С. Опознавание изображений. Основы непрерывно-групповой теории и ее приложения, 1970, ст. 9-12. 3. «Алгоритмы распознавания объектов», Цветков А. А., Шорох Д. К., Зубарева М. Г., Юрсков С. В., Шуклин А. В., Хамуш А. Л., Московский государственный технический университет имени Н. Э. Баумана, с.20-27. 4. Burges, Christopher J. C.; «A Tutorial on Support Vector Machines for Pattern Recognition», Data Mining and Knowledge Discovery 2:121–167, 1998