Інформаційно-пошукова система україномовної дезінформації, фейків та пропаганди для формування датасетів

Автор: Гнатишин Назар Андрійович
Кваліфікаційний рівень: магістр (ОНП)
Спеціальність: Інформаційні системи та технології (освітньо-наукова програма)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Проведене дослідження засвідчує, що проблема дезінформації має глобальний характер, однак для України вона є особливо критичною через постійний тиск з боку гібридних загроз. Хоча у світі вже існують ефективні технології для виявлення неправдивої інформації, в україномовному середовищі все ще відчувається нестача адаптованих інструментів та структурованих наборів даних. Це зумовлює потребу у створенні локалізованих рішень, які б враховували мовну специфіку, соціокультурний контекст та особливості інформаційного середовища. У межах дослідження було обґрунтовано доцільність розробки інформаційно-пошукової системи, призначеної для виявлення дезінформації, фейків та пропаганди саме в україномовному просторі. Системний аналіз, що передував її створенню, включав побудову UML-діаграм і визначення основних компонентів, що забезпечило комплексний підхід до проєктування. Завдяки цьому враховано не лише технічні аспекти, але й важливі чинники, пов’язані з медіаграмотністю, національною безпекою та інформаційною протидією. Розроблена концепція базується на сучасних методах обробки природної мови, технологіях машинного навчання та аналізі поведінкових характеристик інформаційного поширення. Це дало змогу сформувати якісні україномовні датасети та підготувати моделі, здатні ефективно розпізнавати дезінформаційні матеріали. Запропонована технологічна архітектура включає інструменти для збору, обробки, зберігання та візуалізації даних, що забезпечує високу точність, масштабованість і відповідність локальним умовам. У межах реалізації було створено прототип системи, яка здатна автоматично оновлювати базу фейкових повідомлень, обробляти великі обсяги текстової інформації та швидко реагувати на інформаційні вкиди. Інтерфейс, розроблений за допомогою Streamlit, робить систему доступною для широкого кола користувачів – від дослідників і викладачів до практиків у сфері інформаційної безпеки. У подальшому можливе розширення функціональності шляхом інтеграції з популярними платформами обміну повідомленнями, створення мобільних застосунків та впровадження підтримки багатьох мов. Варто підкреслити, що запропоноване рішення має не лише технічне, а й соціокультурне значення. Його застосування сприяє формуванню критичного мислення у суспільстві, навчає перевіряти джерела інформації та розуміти механізми поширення фейкових наративів. Це набуває особливої важливості в умовах інформаційного протистояння, коли оперативність реагування на маніпулятивні повідомлення є ключовим фактором. Інтеграція штучного інтелекту та аналізу великих даних у процес виявлення дезінформації дозволяє зменшити навантаження на фактчекінгові платформи, автоматизуючи типові процеси та забезпечуючи високу швидкість обробки даних. Система може використовуватися не лише як інструмент боротьби з фейками, але й як потужна аналітична платформа для журналістів, аналітиків, освітян та науковців, надаючи їм доступ до релевантної інформації та прогностичних моделей у сфері інформаційної безпеки. Таким чином, упровадження спеціалізованої системи виявлення україномовної дезінформації є не просто технічно можливим, а й вкрай необхідним із точки зору інформаційного захисту країни. Її розвиток та масштабування можуть стати ключовими чинниками підвищення інформаційної стійкості, формування здорового медіасередовища та стимулювання подальших досліджень у сфері цифрової безпеки й медіаграмотності.