Ансамблевий метод машинного навчання для бінарної класифікації даних

Автор: Лісова Юлія Володимирівна
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні технології та системи видавничо-поліграфічних виробництв
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Магістерська робота присвячена дослідженню ансамблевих методів машинного навчання для задачі бінарної класифікації даних. У роботі розглянуто два популярні ансамблеві алгоритми — AdaBoost та Random Forest — та здійснено їх порівняльний аналіз на основі готової вибірки даних, отриманої з платформи Kaggle. Експерименти проведено в програмному середовищі Orange, що забезпечило зручну візуалізацію результатів і можливість аналізу ефективності моделей. Дослідження охоплює налаштування параметрів обох алгоритмів, включаючи кількість ітерацій для AdaBoost та кількість дерев для Random Forest, з метою досягнення оптимальної продуктивності моделей. Крім того, для порівняння була додана неансамблева модель Naive Bayes, що дозволило детальніше проаналізувати переваги ансамблевих методів у контексті точності, повноти, AUC та інших метрик. Результати дослідження показали, що ансамблеві методи, зокрема Random Forest, забезпечують вищу точність і стабільність результатів порівняно з AdaBoost та Naive Bayes. Це підтверджує ефективність ансамблевих моделей для задач бінарної класифікації, особливо на невеликих за обсягом наборах даних. Ключові слова: ансамблеві методи, машинне навчання, бінарна класифікація, AdaBoost, Random Forest, Orange, Naive Bayes.