Методи реалізації комп’ютерного зору на основі штучного інтелекту та вбудованих систем
Автор: Огорілко Роман Ігорович
Кваліфікаційний рівень: магістр (ОНП)
Спеціальність: Телекомунікації та радіотехніка (освітньо-наукова програма)
Інститут: Інститут телекомунікацій, радіоелектроніки та електронної техніки
Форма навчання: денна
Навчальний рік: 2022-2023 н.р.
Мова захисту: українська
Анотація: Швидкий розвиток методів комп’ютерного зору на основі штучного інтелекту та їх інтеграція з вбудованими системами спричинили революцію в різних галузях. Ця інтеграція призвела до розробки методів на основі штучного інтелекту для реалізації комп’ютерного зору у вбудованих системах, таких як методи глибокого навчання. Хоча ці методи мають переваги, такі як висока точність і ефективність, вони також мають певні недоліки, такі як високі обчислювальні вимоги і обмежена інтерпретованість. Одна з основних переваг методів комп’ютерного зору, заснованих на штучному інтелекті, полягає у їхній здатності до навчання на великих обсягах даних і узагальненні нової інформації, яка раніше не була спостережена. Особливо високу ефективність у завданнях комп’ютерного зору показують методи глибокого навчання, оскільки вони можуть навчатися складним ознакам безпосередньо з даних. Наприклад, згорткові нейронні мережі (CNN) стали стандартом для класифікації зображень та виявлення об’єктів, демонструючи найвищу продуктивність на визначених наборах даних. Застосування вбудованих систем комп’ютерного зору, що ґрунтуються на штучному інтелекті, дозволяє виконувати завдання локально, без необхідності швидкого підключення до Інтернету або ресурсів хмарних обчислень. Даний аспект забезпечує надійність, конфіденційність та швидкість виконання завдань у різних сферах застосування. У першому розділі магістерської кваліфікаційної роботи досліджується історичний розвиток методів комп’ютерного зору та їх значення в галузі штучного інтелекту. Розглядається еволюція методів комп’ютерного зору, підкреслюється їх актуальність і застосовність у вбудованих системах. Обмірковуються можливості комп’ютерного зору, підкреслюється ключова роль, яку відіграє штучний інтелект у розвитку його методологій, а також підкреслюється важливість вбудованих систем для реалізації методів комп’ютерного зору на основі штучного інтелекту. Проаналізовано існуючі методи комп’ютерного зору на основі штучного інтелекту, розглянуто їхні переваги та недоліки. Крім того, пропонуються ефективні стратегії для подолання обмежень, пов’язаних із впровадженням комп’ютерного зору на основі ШІ у вбудовані системи. Другий розділ присвячений використанню штучного інтелекту для реалізації комп’ютерного зору у вбудованих системах. Всебічно досліджуються згорткові нейронні мережі (CNN) та їхні фундаментальні компоненти, включаючи згортковий шар, шар об’єднання, шар функції активації та повністю з’єднаний шар. Досліджено рекурентні нейронні мережі (RNN) та процес їх розгортання, а також висвітлено різні типи архітектур RNN. У розділі також подано огляд зворотного розповсюдження в часі як одного з найважливіших механізмів навчання нейронних мереж. Розділ 3 надає практичні відомості про реалізацію моделей ідентифікації об’єктів з використанням комп’ютерного зору та штучного інтелекту. Представлено детальний звіт про процес реалізації з використанням Raspberry Pi та Intel Neural Compute Stick 2. Розглянуто конкретні сценарії, такі як ідентифікація осіб, ідентифікація транспортних засобів та ідентифікація тексту на зображеннях. Представлено застосування Grad-CAM для візуалізації ідентифікації об’єктів. Розглядаються методи прискорення і стиснення нейронних мереж за допомогою квантування, а також їх практичне застосування. Також проаналізовано різні методи квантування, такі як обрізка та дистиляція знань для оптимізації швидкості та розміру моделі. У розділі 4 проаналізовано практичні аспекти покращення якості зображень для моделей. Широко досліджуються генеративні змагальні мережі (GAN), як головний інструмент для покращення зображень з акцентом на архітектурі генератора і дискримінатора. Представлено різні типи GAN, зокрема умовні GAN, глибокі згорткові GAN, генеративні мережі Вассерштейна та CycleGAN. Висвітлено процес навчання нейронних мереж, що включає попередню обробку даних, специфікацію архітектури генератора і дискримінатора, а також оцінку продуктивності нейронної мережі. Крім того, розглядається застосування ESRGAN для покращення зображень, а також аналіз існуючих програм покращення зображень на основі штучного інтелекту. Як результат, магістерська кваліфікаційна робота надає огляд методів комп’ютерного зору на основі штучного інтелекту та їх інтеграції з вбудованими системами. Підкреслюючи актуальність і застосовність комп’ютерного зору у вбудованих системах, а також заглиблюючись у практичні аспекти реалізації моделей ідентифікації об’єктів, покращення якості зображень та вивчення різних архітектур нейронних мереж, зроблено висновки про вдалу взаємодію методів комп’ютерного зору та штучного інтелекту.