Дослідження методів виявлення аномалій віртуалізованих систем з використанням ML
Автор: Марків Іван Ігорович
Кваліфікаційний рівень: магістр
Спеціальність: Системне адміністрування телекомунікаційних мереж
Інститут: Інститут телекомунікацій, радіоелектроніки та електронної техніки
Форма навчання: заочна
Навчальний рік: 2022-2023 н.р.
Мова захисту: українська
Анотація: У роботі розглянуто проблему виявлення аномалій віртуалізованих систем з використанням ML у мережах мобільного зв’язку п’ятого покоління. Зростання ролі віртуалізації мережевих функцій (NFV) і програмноконфігурованих мереж (SDN) полегшує розгортання мережевих фрагментів за допомогою запуску класичних мережевих функцій як програмних додатків у віртуальних машинах (VM) замість виділеного апаратного забезпечення [1]. Однак із дедалі більш широким застосуванням віртуальних машин забезпечення їх безпеки та безперебійної роботи потребує додаткової уваги мережевих адміністраторів [2]. Щоб зберегти безпеку та ізоляцію конфіденційності між фрагментами, потрібно застосовувати принцип компартменталізації на кожному рівні віртуалізації. Крім того, кожен функціональний блок і керований ресурс (наприклад, VNF) у певному слайсі повинні мати власні механізми безпеки, що забезпечують роботу в межах очікуваних параметрів і запобігають доступу неавторизованих об’єктів. Оскільки продуктивність сегментів мережі залежить від нормальної роботи віртуальних машин, важливо своєчасно виявляти аномалії у віртуальних машинах, щоб забезпечити якість обслуговування сегментів мережі. Другий розділ магістерської кваліфікаційної роботи присвячений дослідженню методів забезпечення безпеки та конфіденційності мережевого слайсингу. Слайсинг мережі належить до категорії мережевої парадигми віртуалізації разом із програмнокерованими мережами (SDN) і віртуалізацією мережевих функцій (NFV). Інфраструктурний і функціональний спільний доступ приносить переваги з точки зору витрат і споживання ресурсів, але, в той же час, загострюють проблеми безпеки та конфіденційності даних. Для цього необхідна узгоджена багаторівнева структура безпеки, що складається з політик і механізмів цілісності програмного забезпечення, динамічного виявлення загроз. Середовище віртуалізації мережі може зменшити вартість розгортання та спростити керування життєвим циклом мережевих функцій, але воно створює нові виклики та проблеми управління. Таким чином, побудова ефективної системи моніторингу середовища віртуалізації мережі є життєво важливою для забезпечення її високої доступності та надійності. Враховуючи сучасний стан досліджень в даній області, парадигма розподіленого навчання на основі FL та алгоритми на основі GAN може добре адаптуватися до ієрархічного контролю віртуалізованого нарізання мережі, що полегшує створення глобальної моделі виявлення аномалій без шкоди для ефективності зв’язку та обчислень. Управління та оркестровка рівнів мережі відповідає за контроль кожного віртуалізованого рівня мережі. На основі системної моделі керування віртуалізованою мережею у третьому розділі запропоновано трирівневу розподілену структуру виявлення аномалій для виявлення ненормальної поведінки віртуальних машин у середовищі віртуалізованої мережі. Спираючись на трирівневу структуру управління віртуалізованою мережею, у запропоновано модель виявлення аномалій віртуальної машини на основі федеративного навчання (FL), яка дає змогу менеджерам розподіленої мережі спільно навчати глобальну модель виявлення аномалії віртуальної машини, зберігаючи показники локально. Удосконалено алгоритм BiWGAN-GP, який на відмінну від існуючих використовує для навчання глобальної моделі виявлення аномалій локальні дискримінатори на локальних аналізаторах віртуальних машин. Оцінку аномалії проводитимемо як дискримінантний критерій для кількісної оцінки відхилення даних нових метрик від вивченого нормального розподілу для виявлення ненормальної поведінки, що виникає у віртуальних машинах. Проведено оцінку продуктивності удосконаленого багатодискримінаторного алгоритму BiWGAN-GP на основі FL з точки зору ефективності та результативності. Проведено порівняння продуктивності виявлення аномалій між алгоритмом BiWGAN-GP і найсучаснішими алгоритмами GAN, включаючи GAN, WGAN, WGANGP і BiGAN. У порівнянні з GAN, WGAN, WGAN-GP і BiGAN, точність алгоритму BiWGAN-GP зросла на 4,5%, 2,9%, 2,2% і 1,8% відповідно, відкликання алгоритму BiWGAN-GP зросло на 4,8 %, 2,2%, 2,1% і 2,7% відповідно, а показник F1 алгоритму BiWGAN-GP збільшився на 4,6%, 2,5%, 2,0% і 2,2% відповідно. Проведено дослідження ефективності виявлення аномалій алгоритмів централізованого, автономного, мультидискримінаторного і мультидискримінаторного на основі FL. Як показники ефективності використано параметри precision, recall та F1-socre. Із залежностей представлених у п. 4.3 видно, що значення трьох метрик при використанні будь-якого алгоритму є майже стабільними після 300 ітерацій, що узгоджується з тенденціями збіжності дискримінатора та втрат EG. Результати усіх експериментів на наборі даних реального часу підтверджують ефективність і дієвість удосконаленого багатодискримінаторного алгоритму BiWGAN-GP на основі FL для виявлення типових аномалій віртуальних машин у віртуалізованому середовищі мережі. У роботі знайшли своє застосування методи розподіленої обробки потокових даних, методи виявлення вразливостей інформаційних ситем, методи моніторингу та тренування моделей машинного навчання. Об’єктом дослідження є процес функціонування віртуалізованих систем у мережах мобільного зв’язку п’ятого покоління.. Предметом дослідження є відомі алгоритми машинного навчання за якими створюються моделі, а також використання для їх реалізації сучасного програмного забезпечення. Метою магістерської кваліфікаційної роботи є удосконалення глобальної системи виявлення аномалій у віртуалізованих системах мереж мобільного зв’язку п’ятого покоління із використанням багатокритеріального поділу на мережеві рівні, що у результаті виконнання зможе надавати послугу детектування аномалій, чи то вразливостей з мімімальним впливом на існуючу інфраструктуру.