Інтелектуальна система розпізнавання та обробки тексту з поштовими адресами

Автор: Клічук Сергій Петрович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні системи та мережі
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2020-2021 н.р.
Мова захисту: українська
Анотація: В наш час постає необхідність автоматично обробляти текст замість ручного набору. Одним із таких рішень, що спадає на думку – обробка тексту з зображень [1]. Даний підхід вирішує зразу такі проблеми: - Заощадження часу, бо можна значно скоротити час роботи над таким видом діяльності співробітників. Із таким рівнем оптимізації можна сказати, що співробітники економлять більше робочого часу задля подальшого виконання більш важливих завдань. - Якість введених даних, бо якщо порівнювати результат операцій введених вручну з даною технологією, така автоматизація робить майже неможливими ті помилки, які робляться за рахунок наявності людського фактору. - Скорочення витрат бюджету на обробку документів. Ці гроші можуть бути використані для покращення інших процесів. - Для клієнта все працює краще, швидше та безпомилково, а за статистикою після такої обробки їх лояльність значно зростає. Звісно, що завантажувати зображення або ж документи на персональний комп’ютер здебільшого уже не так зручно як було раніше. У сучасному світі усі люди надають переваги мобільному гаджету – він завжди з нами де б ми не були. Саме такий кишеньковий помічник може і обробляти текст, а також задані фрагменти тексту з зображень, що знаходяться у галереї користувача або ж моментально зробити фото для обробки. Кваліфікаційна робота представляє собою розроблений додаток, який утворює систему для аналізу і обробки тексту з поштовими адресами. За допомогою даної системи, можна розрізняти текст та визначати у ньому 5 скриньки поштових адрес з документів і зображень. Кінцевий продукт був розроблений для платформи андроїд за допомогою інтегрованого середовища розробки (IDE) – Android Studio [2]. Кінцевим результатом даної кваліфікаційної роботи є додаток на базі ОС андроїд [3,4], за допомогою якого реалізуються наступні функції: - розпізнавання і аналіз тексту з зображення; - збереження тексту і зображення, які були розпізнані системою у локальну базу даних; - сортування зображень; - конфіденційність інформації; - розпізнавання поштових скриньок у тексті; На етапі вибору технологій були розглянуті різні архітектурні рішення і серед них вибрано найбільш доречне [5,6]. Спираючись на це, в систему з легкістю можна добавити нові функції у майбутньому. За допомогою вдало вибраного архітектурного підходу система обробляє і зберігає документи на стороні користувача без взаємодії з серверною частиною, що забезпечує конфіденційність усіх оброблених даних даного користувача. В якості вхідних даних виступає низка чорно-білих зображень з розміром в 1080*1080 пікселів. Об’єкт дослідження - дослідження методів розпізнавання тексту з зображень, використання і обробка отриманої інформації. Предмет дослідження - в магістерській кваліфікаційній роботі розглядаються методи розпізнавання тексту з зображення, а також віднаходити задані фрагменти у розпізнаному тексту для пришвидшення обробки інформації у бухгалтерії, медицині і т.д. Мета дослідження: створити систему, що пришвидшує обробку інформації з зображень. Розпізнавати та віднаходити заздалегідь відомі 6 фрагменти тексту у документах і зображеннях. Зменшити економічні витрати у сферах, які пов’язані з масовою обробкою інформації. В ході досліджень були розгянуті усі можливі аналоги обробки тексту з зображень, та виявлено, що альтернативний варіант запропонований даною роботою є одним із найбільш ефективних варіантів. Перелік використаних літературних джерел: 1. Методи обробки зображень – [Електронний ресурс]. – Веб-сторінка: https://web.posibnyky.vntu.edu.ua/fksa/2kvetnyj_komp’yuterne_modelyuvannya_s ystem_procesiv/t2/2..htm 2. Офіційна документація Android Studio – [Електронний ресурс]. –Веб- сторінка: https://developer.android.com/studio/intro 3. Операційна система Android – [Електронний ресурс]. –Веб-сторінка: https://uk.wikipedia.org – Режим доступу: https://uk.wikipedia.org/wiki/Android. 4. Создание приложений на Java и Kotlin – [Електронний ресурс]. –Веб- сторінка: http://www.helloworld.ru/texts/comp/lang/java/java5/index.html 5. Блог Robert C. Martin (Uncle Bob) – [Електронний ресурс]. –Веб-сторінка: https://blog.cleancoder.com/uncle-bob/2012/08/13/the-clean-architecture.html 6. Застосовуєм чисту архітектуру в андроїд додатку – [Електронний ресурс]. – Веб-сторінка: https://five.agency/android-architecture-part-4-applying-clean- architecture-on-android-hands-on/