Моделювання процесів пошуку проблемно-орієнтованих текстів з використанням нейромережевих технологій

Автор: Олійник Андрій Ігорович
Кваліфікаційний рівень: магістр
Спеціальність: Інформаційні технології проектування
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2021-2022 н.р.
Мова захисту: українська
Анотація: Олійник А.І., Белей О.І. Моделювання процесів пошуку проблемно-орієнтованих текстів з використанням нейромережевих технологій. Магістерська кваліфікаційна робота. – Національний університет «Львівська політехніка», Львів, 2021 р. Об’єктом дослідження у даній роботі виступають процеси повнотекстового пошуку із використанням визначення «полярності» документів та смислової приналежності пошукового запиту до знайдених документів. Предметом дослідження є розширення нейромережевих способів аналізу природної мови та сервісів хмарних обчислень і використання хмарних обчислень для покриття функціонування засобів покращення пошуку. Метою роботи є розробка алгоритмів і технології для покращення якості повнотекстового пошуку використовуючи корегування оцінки відповідності документу. Корегування оцінки має проходити із використанням результату отриманого від нейромережевих моделей визначення атрибуту тексту й полярності тексту. Методи обробки природної мови та можливостей повнотекстового пошуку, нейромережевих моделей аналізу є LSTM, Tree-LSTM та HNI, а також модель векторизації тексту GloVe. У вступі показано мету досліджуваного об’єкту, об’єкт і предмет дослідження, актуальність задачі, що ставляться перед даною магістерською кваліфікаційною роботою а також описано практичну цінність даної системи. У першому розділі здійснюється характеристика об’єкту дослідження. Також проведено опис функціональних вимог. У другому розділі здійснено огляд літературних джерел, щодо методів обробки природної мови та можливостей повнотекстового пошуку, нейромережевих моделей аналізу як LSTM, Tree-LSTM та HNI, а також модель векторизації тексту GloVe. У третьому розділі проведений системний аналіз та обґрунтування проблеми, побудовано дерева проблем та цілей, а також описано вибір засобів та методів розробленої системи. А також проходить постановка задачі та розробка програмних засобів. Описана структура модельованої системи. Проведена розробка аналітичної моделі, а також проведена розробка алгоритму класифікації настроїв тексту за допомогою моделі Tree-LSTM. Описуються використовувані в проекті бібліотеки та вибір наборів даних для навчання й тестування, а також вибір гіперпараметрів моделей обробки природної мови. Наведено опис власних технічних рішень наведено інструкції щодо розгортання системи у AWS, вимоги до апаратного забезпечення та результати функціонування системи. Основними результатами досягнення мети у даній роботі є розгляд повнотекстового пошуку інформації, аналізування нейромережевих моделей аналізу природної мови, зокрема моделей, які виконують перегляд логічного слідування та знаходження емоційної полярності текстової інформації, використання хмарних сервісів як платформи для реалізації розробки. Ключові слова – розподілена інформаційна система, пакет даних, модель, хмарні платформи, обробка тексту, повнотекстовий пошук, штучний інтелект. Список використаних джерел: 1. Mykhaylo Melnyk, Andriy Kernyskyy, Muhaylo Lobyr. Comparison of methods for measuring reverberation time // XXV Polish-Ukrainian conference on "CAD in machinery design-implementation and educational problems": book of abstracts (Bielsko Biala, October 20-21, 2017). – 2017. – P.29–30. 2. Melnyk M., Martynyak A., Kernytskyy A. Reverberation time study of an auditorium // Вісник Національного університету «Львівська політехніка». Серія: Комп’ютерні системи проектування теорія і практика: [зб. наук. пр.] / М-во освіти і науки України; голова Ред.-видавн. ради Н.І. Чухрай; [відп. ред. М.В. Лобур]. – 2016. – № 859. – P.56–61.