Система аналізу вартості ремонту транспортних засобів на основі візуальних даних
Автор: Сокирка Ярослав Юрійович
Кваліфікаційний рівень: магістр
Спеціальність: Аналіз даних (Data Science)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2021-2022 н.р.
Мова захисту: українська
Анотація: Важливим компонентом в системі управління та обробки інформації, автоматизованих систем та систем прийняття рішень є процес розпізнавання образів. Основними завданнями, пов’язаними з класифікацією і ідентифікацією предметів, явищ і сигналів, що описуються кінцевим набором деяких властивостей і ознак, виникають в таких галузях як робототехніка, інформаційний пошук, моніторинг та аналіз візуальних даних, дослідження штучного інтелекту. Алгоритмічна обробка і класифікація зображень застосовуються в системах безпеки, контролю та управління доступом, в системах відеоспостереження, системах віртуальної реальності та інформаційних пошукових системах. На сьогоднішній час у виробництві широко використовуються системи розпізнавання рукописного тексту, автомобільних номерів, відбитків пальців або людських осіб. Метою роботи є розробка сиcтeми aнaлiзy вapтocтi peмoнтy тpaнcпopтниx зacoбiв нa ocнoвi вiзyaльниx дaниx, здатного вирішувати проблему інверсії для різних галузей застосування, розпізнаючи тривимірні об’єкти навколишнього світу з урахуванням їх інваріантних перетворень. Об’єктом дослідження дипломної роботи є системи комп’ютерного зору, що здійснюють класифікацію та ідентифікацію об’єктів на зображенні. Предметом дослідження є методи і засоби розробки алгоритмів сиcтeми aнaлiзy вapтocтi peмoнтy тpaнcпopтниx зacoбiв нa ocнoвi вiзyaльниx дaниx. Методи дослідження. Для вирішення поставлених завдань використовувалися методи комп’ютерного зору, теорії оптимізації, математичної статистики, теорії штучних нейронних мереж, імовірнісних моделей, теорії планування експерименту. Наукова новизна дипломної роботи полягає в наступному: • Розроблено математичну модель, здатна інкапсулювавти зображені об’єкти за допомогою ієрархії локальних еквіваріантних ознак, стійких до просторових перетворень. • Розроблено алгоритм навчання згорткової нейромережі на базі моделі еквіваріантного уявлення об’єктів базі потоку візуальних даних без участі експериментатора. • Запропоновано алгоритм ідентифікації та класифікації об’єктів, що використовує CNN згорткову нейронну мережу. 1. Порівняльний аналіз методів розпізнавання зображень показав, що незважаючи на різноманітність підходів до навчання та виділення класифікуючих ознак, більшість методів не розглядає проблему розпізнавання зображень об’єктів під впливом інваріантних тривимірних перетворень. Існуючий клас методів, орієнтованих розпізнавання тривимірних об’єктів, таких як глибокі згорткові мережі та констеляційні моделі, здатний вирішувати завдання інваріантного розпізнавання, проте демонструє обмежену здатність до локалізації об’єктів на зображенні та визначення параметрів їх просторового розташування, що є важливим цілого ряду прикладних завдань обробки інформації. 2. Зазначені недоліки можуть бути усунені за допомогою побудови моделі, що включає в себе інформацію про тривимірну форму зображених об’єктів та використання відповідних алгоритмів навчання та розпізнавання. Як новий підхід для навчання такої моделі пропонується застосувати алгоритм навчання за допомогою потоку даних, що дозволяє вилучати інформацію про просторові взаємини локальних ознак об’єкта та вирішити проблему розпізнавання зображень довільно орієнтованих тривимірних об’єктів. В процесі дослідження предметної області була вивчена робота та структура інформаційної системи СТО. Також досліджено функціональну частину проекту. Базуючись на зібраних даних побудовано діаграму варіантів використання, контекста діаграма, діаграма декомпозиції. 1. Розроблено та представлено комплекс алгоритмів, що виконують завдання навчання моделі та розпізнавання зображень за допомогою розробленої моделі. Запропоновані алгоритми дозволяють повною мірою реалізувати поставлену задачу розпізнавання зображень з виконанням тривимірної просторової локалізації об’єктів. 2. Розроблено алгоритм виділення локальних ознак, що ґрунтується на використання інформатико-теоретичних характеристик зображення та вибір найбільш інформаційно-ємних фрагментів зображення. 3. Розроблено алгоритм оптичного трекінгу, що дозволяє моделі вилучати дані для навчання з кадрів відеопотоку без використання промаркованої вибірки та без участі людини. За результатами проведених експериментів можна зробити наступні висновки: 1. Для представленого методу та трьох альтернативних методів розпізнавання, було проведено комплексне тестування з використанням різних категорій тестових наборів даних, що включають зображення під впливом шуму розмиття та оклюзії. 2. Експериментальна перевірка показала перевагу розробленого методу. Точність розпізнавання під час використання запропонованого методу збільшується на 7-10%. 3. Розроблений метод більш стійкий до локального шуму зображень, підданих розмиття та оклюзії, падіння точності розпізнавання розробленого методу становить 3-5% проти 5-10% альтернативних методів. 4. Точність розпізнавання розробленого методу при зміні орієнтації об’єкта на зображенні має відхилення лише на 4-5 %.