Виявлення фейкових новин за допомогою методів машинного навчання
Автор: Ковбасюк Олександр Михайлович
Кваліфікаційний рівень: магістр
Спеціальність: Інженерія програмного забезпечення
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2022-2023 н.р.
Мова захисту: англійська
Анотація: Дана магістерська кваліфікаційна робота спрямована на дослідження алгоритмів і засобів машинного навчання для виявлення фейкових новин та застосування цих методів у реалізації програмного забезпечення, яке автоматизує вирішення обраної задачі. Було розглянуто та проаналізовано уже розроблені підходи класифікації новин і визначено найбільш ефективні. Також було виявлено проблеми, з якими стикались дослідники. На основі цього було запропоновано власний підхід для розробки вебсервісу виявлення фейкових новин, що базується на використанні BERT моделі та її постійного навчання. Дане програмне забезпечення реалізовано за допомогою фреймворку Django та бібліотеки для машинного навчання Tensorflow. Для документації основних характеристик і функціоналу, якими повинна володіти система, було створено специфікацію вимог. Також для реалізованого веб-сервісу було здійснено попереднє проектування із використанням UMLдіаграм. Було здійснено попереднє навчання моделі на обраних наборах даних, а також досліджено підхід із її постійним навчанням. Результати показали, що періодичне коригування моделі машинного навчання, дозволяє зберігати хорошу точність при виявленні фейкових новин протягом усього часу роботи системи. Робота містить 4 основні розділи та додатки, загальний обсяг становить 61 сторінок. Ключові слова: методи машинного навчання, фейкові новини, BERT модель, безперервне навчання, Tensorflow, Neptune AI.