Система підтримки прийняття рішень опитувальника для онлайн чату
Автор: Аксьонов Денис Андрійович
Кваліфікаційний рівень: магістр
Спеціальність: Системи і методи прийняття рішень
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: Завдяки стрімкому розвитку інформаційних технологій та безперервному збільшенню обсягу доступної інформації в Інтернеті, стає все важливішим питання ефективного пошуку та отримання даних. Зазвичай стандартний пошук за ключовими словами не завжди приносить необхідний результат через відсутність уваги до мовних та смислових зв’язків між словами в запиті. Тому в наш час інтенсивно відбувається прогрес у розвитку технологій обробки природної мови (NLP) та відповідних систем питань-відповідей (Question-Answering Systems, QAS), що використовують ці технології. Natural Language Processing (NLP) - це галузь інформатики та штучного інтелекту, яка займається дослідженням, як комп’ютери можуть розуміти та аналізувати природні (людські) мови. Використовуючи методи машинного навчання, NLP дозволяє комп’ютерам працювати з текстом і мовою. Метою цієї роботи є розробка та імплементація інтелектуального та багатофункціонального Telegram бота, призначеного для поліпшення зручності користування та розширення функціоналу месенджера, за допомогою передових технологій обробки природної мови та машинного навчання. Створений телеграм бот має містити такі функції: • Speech-to-text – конвертація голосових повідомлень користувачів в текст; • Text-to-speech – конвертація текстових повідомлень користувачів в голосові повідомлення; • Text-from-image – розпізнавання тексту на фото та картинках; • Question-answer – знаходження ймовірної відповіді на запитання користувача. На даний час, не існує бота з такою функціональністю, що робить дану ідею інноваційною. Конвертація голосових повідомлень користувачів в текст є актуальним завданням, адже це дуже зручно. Багато людей надсилають голосові повідомлення через те, що це економить час, адже написати текст вручну є довшим процесом ніж записати голосове. Проте, іноді виникають ситуації, коли отримувачі голосових повідомлень не мають можливості прослухати їх. Це може стати серйозною проблемою, особливо, коли отримувач вважає, що це повідомлення може містити важливу інформацію, і він не може досягти спокою, допоки не послухає його. У таких випадках, і не тільки, стане у нагоді створений бот. Користувач може переслати отримане голосове повідомлення боту, який за допомогою своїх функцій перетворить голос на текст і надішле отриману інформацію користувачу після завершення конвертації. Таким чином, користувач зможе дізнатися зміст голосового повідомлення, навіть не прослуховуючи його. Також дана функція дозволить користувачам з обмеженими можливостями, таким як люди з вадами слуху, більш зручно спілкуватися в месенджері. Конвертація текстових повідомлень користувачів в голосові повідомлення може бути корисною функцією для людей, які бажають озвучувати відеоролики власним текстом. Розпізнавання тексту з фото та картинок розширюватиме функціонал телеграму ще більше, і люди можуть отримувати готовий текст не виходячи з додатку та не використовуючи окремі сервіси для цього, які забирають більше часу. Функція «Question-answer» стане корисною для людей, які хотітимуть отримати відповідь на своє запитання, але при цьому не хочуть витрачати багато часу на її пошук використовуючи браузер, в якому є безліч ресурсів та джерел. Дана система несе за собою місію спрощення пошуку відповіді та економію часу користувача. Об’єктом дослідження даної роботи є розробка телеграм бота з функціями speech-to-text, text-to-speech, text-from-image та question-answer. Предметом дослідження є функціональні можливості та ефективність Telegram бота в контексті обробки голосових та текстових повідомлень, розпізнавання тексту на зображеннях та знаходження відповідей на запитання користувачі. Наукова новизна цієї роботи полягає в поєднанні різних технологій для створення корисного та функціонального бота, що може виконувати різні завдання, пов’язані з обробкою природної мови та мультимедіа. В першому розділі було розглянуто предметну область, вивчено ринок та проведено аналіз існуючих аналогів. В другому розділі був проведений системний аналіз та побудовано ряд діаграм, таких як діаграму варіантів використання, діаграму класів, діаграму кооперації, діаграму послідовності, діаграму станів, діаграму компонентів та діаграму розгортання. В розділі номер 3 були проаналізовані методи, які були використані для розробки системи. В четвертому розділі описано реалізацію завдання та проведено тестування результатів. В останньому розділі наведене економічне обґрунтування системи та використані сучасні методи для цього.