Система екологічного моніторингу навколишнього середовища з використанням нейромереж та часових рядів

Автор: Сулимка Роман Орестович
Кваліфікаційний рівень: магістр
Спеціальність: Інженерія програмного забезпечення
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2022-2023 н.р.
Мова захисту: українська
Анотація: Розглянуто сучасні методи прогнозування забруднення, проаналізовано їх переваги та недоліки. У роботі продемонстровано результат передбачення забруднення ґрунтів використовуючи моделі прогнозування на основі часових рядів ARIMA та LSTM. Проаналізовано набір вхідних даних для усунення пропущених значень вибірок забруднення ґрунтів. Проаналізовано моделі для прогнозування часових рядів: наївний метод, ARIMA, SVR та LSTM. Визначено плюси та мінуси кожної з проаналізованих моделей і в результаті аналізу обрано дві моделі для дослідження — ARIMA та LSTM. Оскільки модель LSTM належить до нейронних мереж, то до неї застосовано техніки передавання навченості та точного налаштування для адаптування моделі до задачі прогнозування забруднення ґрунтів. Встановлено, що використання вищезгаданих технік дає змогу отримати високі показники точності прогнозування забруднення за допомогою нейронної мережі. Проведено порівняльний аналіз прогнозування забруднення ґрунтів використовуючи ці моделі. Реалізовано прогноз забруднення повітря на основі моделей ARIMA та LSTM використовуючи набір даних в тисячу записів, для того, щоб порівняти як на моделі впливає кількість вхідних даних. Результати проведеного дослідження свідчать про високу точність алгоритму ARIMA, а використання моделі LSTM для розв’язання задачі прогнозування рекомендується тільки при великій вибірці вхідних даних, та правильному налаштуванню її параметрів. Програмна реалізація моделей розроблена мовою програмування Python з використанням таких бібліотек, як: Numpy - для реалізації алгоритмів прогнозування, Pandas для обробки вхідних даних та Seaborn для візуалізації часового ряду і результатів спрогнозованих значень. На підставі проаналізованих параметрів визначена модель ARIMA, як оптимальна, для прогнозування забруднення ґрунтів для невеликого набору даних, для великого набору даних кращим результатом є LSTM. Ключові слова: Часові ряди, забруднення ґрунтів, прогнозування забруднення, ARIMA, LSTM.