Система аналізу зображень для осіб з особливими потребами
Автор: Сарахман Христина Богданівна
Кваліфікаційний рівень: магістр
Спеціальність: Аналіз даних (Data Science)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2021-2022 н.р.
Мова захисту: українська
Анотація: Всі люди рівні, та не всі мають однакові можливості, в тому числі і фізичні, як-от порушення зору та сприйняття образів. У наш час багато людей незрячі через найрізноманітніші причини: вроджена, часткова втрата зору, аварія чи інші нещасні випадки, фізіологічні фактори, захворювання тощо. Сліпим людям важко адаптуватися в суспільстві, якщо вони нещодавно і раптово втратили зір. Ускладнюючим фактором є відсутність близьких родичів або знайомих людей навколо та відсутність фізичної та психологічної підтримки оточуючих. Для полегшення сприйняття світу для незрячих людей було вирішено вивчити цю тему і знайти можливість якось допомогти. Дане дослідження грунтується на тематиці розпізнавання образів. На цю тематику було розглянуто кілька іноземних досліджень за останні 5-6 років, серед авторів яких є Theo Gevers [1], Jan Cychnerski [2] та Jun Li [3]. Підтвердивши актуальність дослідження, було прийняте рішення провести аналіз ринку наявних технічних вирішень. Здійснений пошук мобільних застосунків здійснюється в сервісах Play Market та App Store. Найвідоміші аналоги, котрі найбільш схожі за призначенням та функціоналом виявлено наступні: Aipoly Vision, Sullivan+ та Supersense. В дослідженні розглянуто та сформульовано бізнес вимоги, користувацькі, функціональні та нефункціональні, які власне і визначають функціонал розроблюваної системи. Розроблюваний проект полягає в тому, щоб система розпізнавала, автоматично описувала і озвучувала те, що є на зображенні, а також і в режимі реального часу, мовою, зрозумілою для людей в динамічному режимі. Такий проект матиме широкий спектр застосування серед людей з вродженою вадою зору, серед тих, хто втратив зір нещодавно та йому складно адаптуватись до нового життя, серед дітей та людей з когнітивними порушеннями і цей список можна продовжувати довго. Також розроблюваний проект матиме своє застосування в інклюзивній освіті, що значно полегшить навчання дітей з обмеженими можливостями. Глобальною ціллю проекту є полегшити, спростити самостійне функціонування людей з особливими потребами шляхом розробки системи аналізу зображень. Об’єкт дослідження – це процес інформаційно-технічного супроводу життєдіяльності осіб з особливими потребами. Предмет дослідження – це система аналізу зображень для осіб з особливими потребами. Мета даної роботи – це розроблення програмного забезпечення для удосконалення інформаційно-технологічної підтримки та супроводу життєдіяльності осіб з особливими потребами. Результатом дослідження є змодельована та побудована система аналізу зображень для осіб з особливими потребами за допомогою UML моделювання та розгляду вимог. А також розроблена перша цільова веб версія системи з можливістю розпізнавання образів за рахунок розробленої та імплементованої згорткової нейронної мережі. Ключові слова: розпізнавання зображень, визначення об’єктів, згорткова нейронна мережа, слабозорі, комп’ютерний зір. Перелік використаних літературних джерел. 1. H. Emrah Tasli, Ronan Sicre, Theo Gevers (2015). SuperPixel based mid-level image description for image recognition. Journal of Visual Communication and Image Representation, 33, 301-308. doi: 10.1016/j.jvcir.2015.09.021 2. Jan Cychnerski, Adam Brzeski, Adrian Boguszewski, Mateusz Marmolowski, Marek Trojanowicz (2017). Clothes detection and classification using convolutional neural networks. 22nd IEEE International Conference on Emerging Technologies and Factory Automation (ETFA). doi: 10.1109/ETFA.2017.8247638 3. Jun Li, Rongkai Wu, Jiaxiang Zhao, Yingdong Ma (2017). Convolutional neural networks (CNN) for indoor human activity recognition using Ubisense system. 29th Chinese Control And Decision Conference (CCDC). doi: 10.1109/CCDC.2017.7978857