Оптимізація маршрутів самокерованих автомобілів за допомогою навчання з підкріпленням

Автор: Логвіненко Іван Іванович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютерні системи управління рухомими об'єктами (автомобільний транспорт)
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: англійська
Анотація: В магістерській роботі розглянуто застосування методів навчання з підкріпленням (Reinforcement Learning, RL) для вирішення задач оптимізації маршрутів самокерованих автомобілів. RL дозволяє самокерованим транспортним засобам адаптувати свої дії до динамічних змін умов середовища, таких як дорожній трафік, погодні умови та аварійні ситуації, що робить цей підхід перспективним для підвищення ефективності автономного транспорту. У першому розділі розкрито основні теоретичні аспекти навчання з підкріпленням, описано принципи функціонування алгоритмів RL, функцію винагороди, а також підходи до моделювання середовища для автономного транспорту. Наведено огляд сучасних досягнень у сфері застосування RL в транспортних системах та їх інтеграції з іншими технологіями, такими як прогнозування трафіку, комп’ютерний зір і глибоке навчання. Другий розділ присвячено аналізу існуючих методів планування маршрутів самокерованих автомобілів. Детально описано особливості реалізації RL у контексті оптимізації маршрутів: використання симуляцій для навчання моделей, облік реального трафіку, прогнозування небезпечних ситуацій, а також інтеграція технологій для оцінки витрат палива та екологічної ефективності. У третьому розділі подано результати моделювання автономного автомобіля із застосуванням RL. Описано блок-схему оптимізації маршруту, що базується на симуляціях реального середовища, розроблено функцію 8 винагороди для досягнення балансу між швидкістю, безпекою та витратами енергії. Проведено серію експериментів, які демонструють, що використання RL дозволяє досягти скорочення часу в дорозі на 15-20% у порівнянні з традиційними методами. Об’єкт дослідження: процеси планування маршрутів самокерованих автомобілів. Предмет дослідження: методи та алгоритми навчання з підкріпленням для оптимізаціїмаршрутів. Мета роботи: розробка ефективного методу оптимізації маршрутів автономних транспортних засобів з використанням RL. Результати дослідження: в результаті роботи розроблено модель оптимізації маршрутів із застосуванням RL, яка дозволяє підвищити ефективність маршрутів автономних автомобілів на основі симуляційного навчання. Ця модель може бути інтегрована у сучасні транспортні системи для забезпечення вищого рівня адаптивності до змінних умов середовища. Ключові слова: самокеровані автомобілі, навчання з підкріпленням, оптимізація маршрутів, алгоритми, симуляція, функція винагороди, трафік. Перелік використаних літературних джерел: 1. Sutton R. S., Barto A. G. Reinforcement Learning: An Introduction. MIT Press, 2018. 2. Silver D. et al. Mastering the game of Go with deep reinforcement learning. Nature, 2016. 3. Шамсуров Д. С., Задорожний М. А. Машинне навчання в автономних транспортних системах. Київ: Техніка, 2021. 4. Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press, 2016. 5. Dosovitskiy A. et al. CARLA: An Open Urban Driving Simulator. PMLR, 2017.