Графічний редактор з функцією покращення якості зображення

Автор: Максимів Микола Романович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні системи та мережі
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2021-2022 н.р.
Мова захисту: англійська
Анотація: У даній магістерській кваліфікаційній роботі описується дослідження та реалізація графічного редактора з функціоналом покращення якості зображення на основі нейронних мереж. Робота складається з 5 зв’язаних між собою розділів: аналізу задачі розробки, проектування графічного редактора, реалізація проекту, експериментальні дослідження та економічною частини розробки. Зараз дуже важко уявити наше буденне життя без фотографій. А це, в свою чергу, породжує іншу потребу – змінення і удосконалення зроблених фото, наприклад: вирізання якоїсь деталі з фото, добавлення фільтру, зменшення об’єму зображення, додавання надпису. На щастя людство також придумало способи обробки цифрових зображень. Так з’явились графічні редактори зображень. Функціонал сучасних графічних редакторів доволі широкий, користувач має змогу накладати різноманітні фільтри на фотографію, по типу контрастності, яскравості, кольору; добавляти текст, фігури, маски; збільшувати/зменшувати розмір фото, міняти співвідношення сторін, вирізати елементи і тд. Але все це є стандартними методами обробки цифрових фотографій, які доступні в більшості існуючих програм. Але постає питання: як обробляти фотографію користувачеві, якщо фото вийшло неякісне, на ньому присутні шуми, або воно є з низькою роздільною здатністю? Навіть з розвитком технологій, об’єктив камери користувача може створювати фото з низькою роздільною здатністю, що в свою чергу унеможливлює подальшу роботу з ним. В ході аналізу існуючих рішень графічних редакторів було сформовано ряд нововведень в сфері обробки цифрових зображень та критеріїв розробки. Взявши до уваги переваги та недоліки програм-прототипів, було запропоновані такі нововведення, які б вирішили актуальні проблеми сфери роботи з цифровими зображеннями: Інструменти автоматичного оброблення фотографій штучним інтелектом. Можливості сучасного штучного інтелекту вражають. Якщо успішно натренувати модель нейронної мережі [1, 2] штучного інтелекту, і добавити її в програму, користувачам відкриються нові можливості обробки фотографій. Дане рішення виправить ряд недоліків, пов’язаних з обробленням фотографій з низькою роздільною здатністю, а також дозволить покращити якість самого фото. Впровадження в програму нейронних мереж не обмежується лише функціоналом покращення якості. У більшості людей є старі чорно-білі фотографії з часів, коли кольорові об’єктиви фотокамер ще були недоступні. Тому було вирішено добавити додатково і функціонал «відновлення» природнього кольору на чорно-білих фотографіях за допомогою штучного інтелекту. В купі з моделлю покращення якості, даний функціонал дозволить дати «нове життя» старим чорно-білим фотографіям. Кросплатформність [3] – критерій успішності сучасного продукту програмного забезпечення. Більшість аналогів-прототипів доступні лише на одній операційній або у браузері. Тому було прийнято рішення, щоб розроблена програма працювала і у браузері в режимі веб-додатку, і у режимі настільної програми для операційних систем Windows/MacOS. Під час проектування програми було проведено дослідження сучасних технологій, алгоритмів та існуючих рішень для створення ефективного графічного редактора, який б задовольняв сформовані критерії розробки. Для вибору архітектури нейронної мережі був проведений порівняльний аналіз сучасних ефективних архітектур побудови нейронної мережі. Для реалізації даного проекту ідеально підходить 2 архітектури: генеративні змагальні мережі (GAN) [4, 6] та залишкові мережі (ResNet) [5]. Для кожного рішення було сформовано список переваг і недоліків кожної мережі, які в результаті дали чітку відповідь, що найкращою архітектурою мережі для даного проекту є алгоритм SRGAN [6] на базі архітектури GAN. Об’єкт дослідження – дослідження методів побудови сучасного графічного редактора; аналіз сучасних методів збільшення роздільної здатності фотографії зі збереженням або покращенням якості; методи створення та навчання штучного інтелекту. Предмет дослідження –в магістерській кваліфікаційній роботі описується реалізація проекту графічного редактора з функціями покращення якості зображення та відновлення кольору чорно-білої фотографії на основі натренованої нейронної мережі. Мета дослідження – створення ефективного і якісного продукту програмного забезпечення, яке б вирішувало ряд існуючих проблем при обробці цифрових зображень; надавало користувачеві нові можливості і функції, які є відсутні або працюють некоректно в існуючих лідерів в сфері програм обробки растрової графіки. В ході перевірок та досліджень цілісності, якості та ефективності створеної кросплатформної програми було наведено результати роботи програми, описана методологія тестування та відлагодження програми. Проведений аналіз роботи функціоналу покращення якості та колоризації фотографій показав, що у порівнянні з аналогами, даний функціонал проявляє себе краще ніж існуючі рішення, а також повністю виконує поставлені завдання та критерії, які були сформовані при проектуванні програми. Для підтвердження даного висновку було наведені кількісні та якісні показники ефективності трансформації зображення в програмі. Ключові слова: графічний редактор, цифрові зображення, нейронні мережі, багатоплатформність, генеративні змагальні мережі, покращення якості, колоризація фотографій Перелік використаних літературних джерел: Tao Yang, “Handbook of CNN Image Processing: All You Need to Know about Cellular Neural Networks Paperback”, September 10, 2002, 26-48pp. Peter Norvig: “Paradigms of Artificial Intelligence Programming: Case Studies in Common”, Morgan Kaufmann; 1st edition (October 15, 1991), 976p. ISBN: 978-1558601918. “Cross-Platform App Development – Explore Frameworks, Technology and Business Benefits”. [Електронний ресурс] - Режим доступу до ресурсу: https://asperbrothers.com/blog/cross-platform-app-development/ Arun Solanki, Anand Nayyar. “Generative Adversarial Networks”, 2011, DOI: https://doi.org/10.1016/C2020-0-00284-7 Vincent Feng: “An Overview of ResNet and its Variants”, Jul, 2017. [Електронний ресурс] - Режим доступу до ресурсу: https://towardsdatascience.com/an-overview-of-resnet-and-its-variants-5281e2f56035 Kailash Ahirwar : “Generative Adversarial Networks Projects”, Packt Publishing, Jan, 2019. ISBN: 9781789136678.