Розпізнавання фішингових URL адрес методами машинного навчання
Автор: Іваник Роман Тарасович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні технології та системи видавничо-поліграфічних виробництв
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Ця робота присвячена розробці та аналізу методів розпізнавання фішингових URL сайтів на основі алгоритмів машинного навчання. Фішингові атаки становлять серйозну загрозу для безпеки користувачів в інтернеті, оскільки вони спрямовані на викрадення конфіденційної інформації через підроблені вебсайти. Тому питання автоматичного розпізнавання фішингових URL є актуальним і має важливе практичне значення. В рамках дослідження використовувався графічний інструмент для аналізу даних Orange, де було застосовано шість різних алгоритмів класифікації: Random Forest, AdaBoost, SVM, Neural Network, Gradient Boosting та Naive Bayes. Датасет складався з 11 430 URL, які були попередньо класифіковані як фішингові або нефішингові. Для підвищення достовірності результатів застосовувалися стандартні процедури підготовки даних, включаючи розділення на тренувальну та тестову вибірки. У роботі було проведено всебічне порівняння ефективності кожного з алгоритмів за ключовими метриками якості. Результати експериментів показали, що деякі алгоритми, такі як Random Forest та Gradient Boosting, досягають вищих показників точності у виявленні фішингових URL порівняно з іншими методами. Проте, кожен алгоритм має свої особливості та обмеження, що детально обговорюється в роботі. Отримані результати можуть бути використані для розробки більш ефективних систем захисту від фішингу та інтеграції цих моделей у системи кібербезпеки. Ключові слова: машинне навчання, фішинг, класифікація, відбір характеристик, алгоритм, фішинговий сайт, соціальна інженерія.