Мережі Баєса та їх застосування у фільтрації новинної стрічки

Автор: Ластовецький Олег Ігорович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні системи та мережі
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2021-2022 н.р.
Мова захисту: українська
Анотація: Фільтри спаму сьогодні є надзвичайно важливою частиною будь-якого медійного сервісу. Адже де є інформація, там є і дезінформація. Правда спамом може бути не тільки неправдиве повідомлення, а і реклама, або ж листи шахрайського походження. В якості технології фільтрації спаму я обрав мережі Баєса. Як на мене дана технологія не тільки доволі ефективна, а і досить перспективна, адже наразі використовує не весь свій потенціал. В ході роботи було проаналізовано існуючі засоби фільтрації спаму саме для соціальної мережі Facebook та проведено тестування експлуатації аналогів. Відтак змогли визначити основні недоліки і те, на що потрібно звернути увагу при розробці власного засобу. Також було досліджено наївну фільтрацію спаму Баєса та її основні проблеми. В роботі описано таке явище як прокляття розмірності, яке і є основною причиною існування такої технології. Також був прокладений математичний фундамент для кращого розуміння алгоритму. Дослідили таке поняття як баєсівське отруєння, а також як з ним боротися. В кінці розділу також було приведено основні переваги та недоліки технології. В роботі описаний не тільки процес створення розширення, а також проведене тестування роботи розширення з веденням статистики результатів даного розширення. В кінці був проведений економічний аналіз розробки на предмет економічної доцільності, результатом якого стало те, що розробка є економічно доцільною. Ключові слова: Manifest, bayesjs, Facebook Перелік використаних джерел. 1. Баєсове отруєння: веб-сайт. URL: https://uk.azartwiki.com/970372-bayesian-poisoning-WRLCEU 2. Наївна фільтрація спаму Баєса: веб-сайт URL: https://uk.wikisko.ru/wiki/Naive_Bayes_spam_filtering#History