Система аналізу тарифного плану користувачів мобільного оператора

Автор: Мотрунич Владислав Іванович
Кваліфікаційний рівень: магістр
Спеціальність: Аналіз даних (Data Science)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Сучасний телекомунікаційний ринок відзначається високою конкуренцією, стрімким розвитком технологій і зміною уподобань споживачів. Ці тенденції створюють додаткові виклики для мобільних операторів, які прагнуть забезпечити стабільність клієнтської бази та підвищити свою конкурентоспроможність. Одним із ключових напрямів вдосконалення бізнес-моделей у цій сфері є персоналізація послуг, що вимагає глибокого розуміння потреб абонентів. Водночас, зростаючі обсяги даних, які оператори отримують від користувачів, відкривають нові можливості для впровадження інтелектуальних систем підтримки рішень. У даній магістерській роботі вирішується завдання прогнозування змін тарифних планів абонентів за допомогою методів машинного навчання Об’єктом дослідження є процес, що впливає на рішення користувача щодо зміни тарифного плану. Предметом дослідження передбачення рішення користувача, щодо зміни тарифного плану Метою роботи є розробка ефективної моделі машинного навчання, яка зможе прогнозувати зміну тарифного плану користувачем на основі аналізу історичних даних та поведінки абонента. Процес розробки системи базується на використанні методології CRISP-DM (Cross-Industry Standard Process for Data Mining), яка охоплює всі етапи роботи з даними: від бізнес-аналізу до впровадження готової моделі. На першому етапі дослідження було виконано аналіз потреб маркетингового відділу оператора. Це включало визначення ключових факторів, які впливають на зміну тарифного плану, таких як історія користування послугами, поведінкові патерни та демографічні дані абонентів. Другий етап передбачав збір та обробку даних. Для формування навчальної вибірки використовувалися історичні дані про тарифні плани, обсяги використання послуг та профілі користувачів. Проведено нормалізацію, кодування категоріальних змінних та обробку пропущених значень за допомогою спеціалізованих алгоритмів. Для підготовки даних використовувалася бібліотека Pandas, що забезпечила ефективну маніпуляцію великими масивами даних. Наступним етапом стала розробка моделі прогнозування. Було випробувано кілька підходів до класифікації, зокрема алгоритми градієнтного бустингу (XGBoost), дерева рішень та ансамблеві методи (bagging, boosting). У процесі роботи враховано проблему незбалансованості даних, оскільки більшість користувачів залишаються на поточному тарифному плані, що створює диспропорцію у вибірці. Особливу увагу було приділено оцінці якості моделей. Для вимірювання точності прогнозів використовувалися метрики точності, повноти, F1-міри та AUC-ROC. Завдяки використанню ROC-кривих було визначено оптимальні пороги класифікації, що підвищило загальну ефективність системи. У процесі оптимізації гіперпараметрів застосовувався метод пошуку по сітці (Grid Search), що дозволило знайти найкращі гіперпараметри для моделі. Оцінка результатів показала, що найкращих результатів досягнуто при використанні XGBoost, який продемонстрував високу точність і здатність до роботи з великими масивами даних. Аналітична система була інтегрована в робочі процеси за допомогою хмарної інфраструктури AWS, що забезпечило її масштабованість і стабільність роботи. Розроблена система має значну практичну цінність. Вона дозволяє мобільному оператору прогнозувати зміни тарифів, що дає змогу своєчасно пропонувати клієнтам персоналізовані пропозиції. Це сприяє підвищенню рівня задоволеності клієнтів, зниженню ризиків відтоку та збільшенню середнього доходу на одного користувача. Наприклад, завдяки аналізу даних про перевищення обсягу інтернет-трафіку можна заздалегідь запропонувати клієнту вигідніший тариф із більшим обсягом послуг. Окрім прогнозування, система сприяє оптимізації маркетингових кампаній, дозволяючи орієнтуватися на цільові сегменти клієнтів. Це знижує витрати на рекламу та підвищує її ефективність, оскільки персоналізовані пропозиції мають більшу конверсію. Наукова новизна роботи полягає у створенні індивідуальної моделі прогнозування, що враховує особливості локального ринку та специфіку даних конкретного оператора. Це дозволяє значно перевищити точність прогнозів, порівняно з універсальними рішеннями. Результати дослідження підкреслюють важливість інтеграції інноваційних методів аналізу даних у бізнес-процеси телекомунікаційних компаній. З урахуванням стрімкого впровадження технологій 5G та зростання обсягів даних, розробка таких систем є вкрай актуальною. Ключові слова: • машинне навчання; • прогнозування; • тарифні плани; • телекомунікації; • аналіз даних; • персоналізація.