Виявлення аномалій у часових ГНСС - рядах методами машинного навчання
Автор: Гайдусь Олег Андрійович
Кваліфікаційний рівень: магістр
Спеціальність: Космічна геодезія
Інститут: Інститут геодезії
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: У сучасному світі технологічний прогрес у сфері глобальних навігаційних супутникових систем (ГНСС) дозволяє вдосконалювати якість та кількість геодезичних даних. Це призвело до розробки нових методів обробки та аналізу геодезичних часових рядів даних з різних космічних місій. Технологічний прогрес також дозволяє інтегрувати розширені математичні моделі з високопродуктивним програмним забезпеченням для вчасної реакції на виклики та вдосконалення методів обробки даних ГНСС. Обчислювальне програмне забезпечення стає потужним та забезпечує науковцям інструменти для більш ефективної обробки та інтерпретації великих обсягів даних. Накопичення даних ГНСС-станцій, які працюють понад декілька десятиліть потребують математичних підходів до виділення аномалій, які на великих часових рядах можуть візуально не виділятися. Тому для довгих ГНСС-рядів розробка алгоритмів, які би могли виділити одночасні аномалії на декількох станціях є актуальною задачею. Виявлення аномалій у даних ГНСС є одним із перспективних методів моніторингу сейсмічної активності. Аномалія - це відхилення від нормального поведінки. Аномалії у даних ГНСС можуть бути пов’язані з сейсмічною активністю. Ця інформація може бути використана для виявлення закономірностей у змінах положення станцій, які можуть бути пов’язані з сейсмічною активністю. Точні та надійні методи виявлення розривів у часових рядах допомагатимуть у вирішенні проблем, пов’язаних з невідомими аномаліями у даних та забезпечать коректність подальшого аналізу часових рядів ГНСС. Аномалії можуть бути викликані різними факторами, включаючи сейсмічні події, погодні умови, техногенні катастрофи та інші. Вони можуть призвести до спотворення результатів аналізу даних, що може мати серйозні наслідки для безпеки та економіки. Виявлення сейсмічних подій є важливим завданням, яке може допомогти в зменшенні ризику людських жертв та матеріальних збитків. Раннє виявлення сейсмічних подій може дати достатньо часу для евакуації людей із зони ризику та запобігання або зменшення масштабів руйнування. Метод машинного навчання, представлений у дослідженні, є перспективним підходом до виявлення сейсмічних подій. Метод заснований на використанні алгоритму Isolation Forest, який виявляє викиди в даних, які можуть вказувати на потенційні аномалії. На першому етапі запропонованого алгоритму дані ГНСС з однієї станції обробляються за допомогою наступних кроків: читання даних із текстового файлу, розрахунок відстаней, тренування моделі, прогнозування аномалій, визначення аномалій, візуалізація початкових аномалій, візуалізація останніх аномалій, інженерія ознак, налаштування гіперпараметрів моделі. На другому етапі дослідження було проведено наступні роботи: Відбір даних, обробка даних, виявлення аномалій за алгоритмом Isolation Forest. Об’єкт дослідження – часові ряди даних ГНСС. Предмет дослідження – аномалії в часових рядах даних ГНСС, які можуть бути викликані сейсмічною активністю. Мета дослідження – розробка методу виявлення аномалій в часових рядах даних ГНСС для виявлення відомих сейсмічних подій. Результати дослідження – досліджено сучасні тенденції розвитку алгоритмів машинного навчання у геодезії. Розроблено алгоритм машинного навчання на основі алгоритму Isolation Forest. Вивлено аномалії навколо відомої сейсмічної події для однієї, двох та п’яти ГНСС станцій. Однією з вагомих переваг методу є згущення аномалій навколо сейсмічної події, що полегшує виявлення закономірностей у змінах положень ГНСС-станцій на значній відстані від епіцентру сейсмічної події. Це може бути важливим для подальших досліджень та аналізу геодинамічних явищ у реальному часі. У результаті дослідження було показано, що метод виявлення аномалій на основі даних ГНСС є перспективним для моніторингу та передбачення сейсмічних явищ. Однак, для підвищення точності методу необхідно провести додаткові дослідження, спрямовані на зменшення кількості хибно позитивних результатів.