Система прийняття рішень у умовах невизначеності на основі стохастичної гри нейроагентів

Автор: Чех Юрій Григорович
Кваліфікаційний рівень: магістр
Спеціальність: Системи і методи прийняття рішень
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: Напротязі останнього десятиліття серед різноманітних напрямів штучного інтелекту на одне з ведучих міст все більше предендують дослідження, які об’єднують під загальною назвою «мультиагентні системи». Взагалі кажучи, дослідження по інтелектуальним агентам та багатоагентним системам мають вже майже сорокарічну історію, але тільки в останні роки ці дослідження насправді оформились в самостійний широкий та багатоплановий розділ штучного інтелекту, який притягує до себе кращих дослідників з різних областей, причому не тільки штучного інтелекту. Причин такої зацікавленості щодо мультиагентних систем немало, і вони різні, але головна полягає в тому, що ця зацікавленість зумовлена досягненнями в області інформаційних технологій, штучного інтелекту, розпреділених інформаційних систем, комп’ютерних мереж та комп’ютерної техніки. Мультиагентні системи мають реальну можливість інтегрувати в собі найбільш передові досягнення перечислених областей, демонструючи принципово нові якості. Можна без сумнівів стверджувати, що поява цього напрямку свідчить про новий рівень, досягнутий в області інформаційних технологій та штучного інтелекту зокрема, а темпи його прогресу дають привід передбачати йому ведучу роль в найближчі десятиліття в широкому крузі програмних систем. Об’єктом дослідження є процес розподіленого вироблення та прийняття колективних рішень в мультиагентних системах, що функціонують в умовах невизначеності. Предметом дослідження є модель прийняття рішень у умовах невизначеності на основі стохастичної гри нейроагентів з алгоритмами навчання без учителя. З метою розуміння та пояснення роботи нервовоої системи тварин та людей, були розроблені прості математичні моделі нервових кліток (нейронів), які можуть об’єднуватись в штучні нейронні мережі різної складності. Індивідуальні нейрони є будівельними блоками для більш складних нейронних мереж. Навіть найпростіші будівельні блоки таких мереж, нейрони МакКалоха-Пітта, є достатньо цікавими для індивідуального аналізу. Така мережа, що також носить назву простого перцептрона, може виконувати обмежену, але нетривіальну класифікацію, а також навчатися по невідомим правилам. Дана модель формалізує дві особливості біологічних нейронів: вони отримують сигнали від інших клітин через синаптичні канали, а також вони активізуються у випадку, якщо сумарний вхід перевищить деякий визначений поріг і не активізуються у протилежному випадку. Для підвищення складності та реалістичності задач, в порівнянні з простим перцептроном, пропонуються два основні напрямки: перший полягає в конструюванні більш складних структур на основі простих перцептронів, таких як багатошарові мережі, мережі асоціативної пам’яті та рекурентів мережі. Цей напрямок тісно зв’язаний з комп’ютерними науками та машинним навчанням. Інший напрямок зосереджується на залученні більш точних біологічних мехінізмів, таких як явне моделювання клітинної мембрани та регуляція порогу. Так як дані методи є важкими для аналітичного підходу, вони можуть використовуватися для емуляції біологічних проблем розпізнавання образів аналітично. В даній дипломній роботі буде використовуватися найпростіша архітектура, застосовна для вирішення поставленої задачі, а саме, прості та безперервні перцептрони. Розуміння принципів їхньої взаємодії є непростим завданням. Наукова новизна - розроблено нейроагентну модель в розумінні теорії ігор, де індивідуальні нейрони повинні оптимальним чином поводитись в даній матриці виграшів. Проводиться теоретичний аналіз обраної моделі нейронної системи та вказується, що теорія ігор може виступати в ролі організаційного основи для таких систем. Метою роботи є розроблення програмних засобів моделювання стохастичної гри нейроагентів для колективного вибору варіантів рішень в умовах невизначенсті. В основі роботи нейронних мереж для оптимізації поведінки в ході гри лежать алгоритми навчання для нейронних мереж, оптимізовані для теорії ігор.