Технології штучного інтелекту в комп'ютерних та кіберфізичних системах
Спеціальність: Комп'ютерні системи та мережі
Код дисципліни: 7.123.01.O.005
Кількість кредитів: 3.00
Кафедра: Електронні обчислювальні машини
Лектор: професор Куриляк Дозислав Богданович
Семестр: 1 семестр
Форма навчання: денна
Завдання: Виробити у студентів систематизоване уявлення про основні положення та принципи теорії інтелектуальних систем, методи машинного навчання та принципи самоорганізації; надати навички практичної реалізації автономних інтелектуальних систем.
Результати навчання: знати:
сфери застосування КСШІ; бази знань;
логічні моделі подання знань у КСШІ; метод резолюцій;
нечіткі множини; методи виведення за нечітких умов;
семантичні мережі; продукційні моделі; фрейми;
нейронні мережі; методи прийняття рішень;
розпізнавання образів; типи задач розпізнавання;
методи та алгоритми класифікації образів;
теоретичні аспекти машинного перекладу; рівні розуміння та їх класифікація;
особливості розробки та використання експертних систем
Необхідні обов'язкові попередні та супутні навчальні дисципліни: пререквізити:
- комп'ютерні системи;
- системне програмування
- технології проектування комп'ютерних систем.
Короткий зміст навчальної програми: Сучасні методи КСШІ і їх застосування;
Методи формування баз знань
Робота з моделями знаньІ
Застосування до проектування КСШІ
Опис: 1. Інтелектуальна система. Поняття штучного інтелекту. Основні напрямки досліджень в області штучного інтелекту. Основні концепції штучного інтелекту. Використання методів штучного інтелекту для побудови інтелектуальних систем. Основні ідеї та визначення ТІС. Поняття інтелектуальної системи. Проблема розробки інтелектуальних систем. Прийняття рішень в умовах невизначенності.
2. Mоделювання простих форм цілеспрямованої поведінки. Математичне моделювання простих форм цілеспрямованої поведінки. Стаціонарне випадкове середовище. Автомати, що навчаються (learning automata). Асимптотично-оптимальні послідовності симетричних автоматів, що навчаються. Випадкове середовище з перемиканням станів. Поведінка автоматів, що навчаються, в випадкових середовищах з перемиканням станів. Каскад двох автоматів з лінійною тактикою. Стохастичні автомати зі змінною структурою. Колективна поведінка автоматів, що навчаються.
3. Навчання з підкріпленням (Reinforcement Learning). Навчання обчислювальних машин (machine learning). Класифікація методів навчання машин (machine learning). Навчання з підкріпленням (reinforcement learning). Постановка узагальненої задачі навчання з підкріпленням. Класифікація задач навчання з підкріпленням. Однофакторне випадкове середовище (Мulti-armed bandit problem). Метод зваженної оцінки дій (action-value method). Узагальнена форма методів зваженої оцінки дій. Метод експоненціального (зваженого по давнині) усереднення. Метод нормованої експоненціальної функції (softmax action selection). Метод на основі стохастичного градієнтного підйому. Метод верхньої довірчої межі (Upper-Confidence-Bound action selection). Порівняння ефективності методів навчання з підкріпленням в однофакторному випадковому середовищі. Однофакторне випадкове середовище з контекстною залежністю (Contextual bandit). Марківський процес прийняття рішень (Markov Decision Process). Пошук оптимальної стратегії для відомої моделі MDP. Методи навчання з підкріпленням на основі часових різниць (Temporal difference learning). Метод адаптивної евристичної оцінки (Adaptive Heuristic Critic). Метод навчання з підкріпленням SARSA. Метод навчання з підкріпленням Q-learning.
4. Архітектура інтелектуального агента. Поняття архітектури інтелектуального агента. Архітектури агентів на основі моделей логічного мислення. Архітектура інтегрального підпорядкування (Р.Брукс). Порівняння когнітивних та реактивних архітектур інтелектуальних агентів. Комбіновані архітектури інтелектуальних агентів. Напрямки розвитку архітектур інтелектуальних агентів.
5. Багатоагентні системи (Multi-agent systems). Поняття багатоагентної системи. Концептуальна модель багатоагентної системи. Алгоритмічне забезпечення багатоагентних систем. Механізми координації колективної поведінки інтелектуальних агентів. Навчання з підкріпленням в багатоагентних системах. Проблема розпізнавання стану та інтерпретації відгуку середовища. Класифікація задач колективного навчання з підкріпленням. Моделі колективного навчання. Інформаційна взаємодія агентів в процесі навчання. Моделі інформаційної взаємодії інтелектуальних агентів. Навчання розподілу обов'язків в багатоагентній системі (learning organizational roles).
6. Розробка автономних інтелектуальних систем на основі принципів самоорганізації. Поняття самоорганізації. Способи оцінки процесу самоорганізації. Оцінка процесу самоорганізації на основі шенонівської ентропії. Модель процесу самоорганізації Гайнца фон Фьорстера. Самоорганізація в автономних децентралізованих системах. Моделі структурної самоорганізації.
Методи та критерії оцінювання: Підсумковий контроль (залік): письмова форма (50 %), усна форма (50%).
Критерії оцінювання результатів навчання: 1. Інтелектуальна система. Поняття штучного інтелекту. Основні напрямки досліджень в області штучного інтелекту. Основні концепції штучного інтелекту. Використання методів штучного інтелекту для побудови інтелектуальних систем. Основні ідеї та визначення ТІС. Поняття інтелектуальної системи. Проблема розробки інтелектуальних систем. Прийняття рішень в умовах невизначенності.
2. Mоделювання простих форм цілеспрямованої поведінки. Математичне моделювання простих форм цілеспрямованої поведінки. Стаціонарне випадкове середовище. Автомати, що навчаються (learning automata). Асимптотично-оптимальні послідовності симетричних автоматів, що навчаються. Випадкове середовище з перемиканням станів. Поведінка автоматів, що навчаються, в випадкових середовищах з перемиканням станів. Каскад двох автоматів з лінійною тактикою. Стохастичні автомати зі змінною структурою. Колективна поведінка автоматів, що навчаються.
3. Навчання з підкріпленням (Reinforcement Learning). Навчання обчислювальних машин (machine learning). Класифікація методів навчання машин (machine learning). Навчання з підкріпленням (reinforcement learning). Постановка узагальненої задачі навчання з підкріпленням. Класифікація задач навчання з підкріпленням. Однофакторне випадкове середовище (Мulti-armed bandit problem). Метод зваженної оцінки дій (action-value method). Узагальнена форма методів зваженої оцінки дій. Метод експоненціального (зваженого по давнині) усереднення. Метод нормованої експоненціальної функції (softmax action selection). Метод на основі стохастичного градієнтного підйому. Метод верхньої довірчої межі (Upper-Confidence-Bound action selection). Порівняння ефективності методів навчання з підкріпленням в однофакторному випадковому середовищі. Однофакторне випадкове середовище з контекстною залежністю (Contextual bandit). Марківський процес прийняття рішень (Markov Decision Process). Пошук оптимальної стратегії для відомої моделі MDP. Методи навчання з підкріпленням на основі часових різниць (Temporal difference learning). Метод адаптивної евристичної оцінки (Adaptive Heuristic Critic). Метод навчання з підкріпленням SARSA. Метод навчання з підкріпленням Q-learning.
4. Архітектура інтелектуального агента. Поняття архітектури інтелектуального агента. Архітектури агентів на основі моделей логічного мислення. Архітектура інтегрального підпорядкування (Р.Брукс). Порівняння когнітивних та реактивних архітектур інтелектуальних агентів. Комбіновані архітектури інтелектуальних агентів. Напрямки розвитку архітектур інтелектуальних агентів.
5. Багатоагентні системи (Multi-agent systems). Поняття багатоагентної системи. Концептуальна модель багатоагентної системи. Алгоритмічне забезпечення багатоагентних систем. Механізми координації колективної поведінки інтелектуальних агентів. Навчання з підкріпленням в багатоагентних системах. Проблема розпізнавання стану та інтерпретації відгуку середовища. Класифікація задач колективного навчання з підкріпленням. Моделі колективного навчання. Інформаційна взаємодія агентів в процесі навчання. Моделі інформаційної взаємодії інтелектуальних агентів. Навчання розподілу обов'язків в багатоагентній системі (learning organizational roles).
6. Розробка автономних інтелектуальних систем на основі принципів самоорганізації. Поняття самоорганізації. Способи оцінки процесу самоорганізації. Оцінка процесу самоорганізації на основі шенонівської ентропії. Модель процесу самоорганізації Гайнца фон Фьорстера. Самоорганізація в автономних децентралізованих системах. Моделі структурної самоорганізації.
Порядок та критерії виставляння балів та оцінок: 100-88 балів - атестований з оцінкою «відмінно» - Високий рівень: здобувач освіти демонструє поглиблене володіння поняттєвим та категорійним апаратом навчальної дисципліни, системні знання, вміння і навички їх практичного застосування. Освоєні знання, вміння і навички забезпечують можливість самостійного формулювання цілей та організації навчальної діяльності, пошуку та знаходження рішень у нестандартних, нетипових навчальних і професійних ситуаціях. Здобувач освіти демонструє здатність робити узагальнення на основі критичного аналізу фактичного матеріалу, ідей, теорій і концепцій, формулювати на їх основі висновки. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку, самостійної науково-дослідної діяльності, що реалізується за підтримки та під керівництвом викладача. 87-71 балів - атестований з оцінкою «добре» - Достатній рівень: передбачає володіння поняттєвим та категорійним апаратом навчальної дисципліни на підвищеному рівні, усвідомлене використання знань, умінь і навичок з метою розкриття суті питання. Володіння частково-структурованим комплексом знань забезпечує можливість їх застосування у знайомих ситуаціях освітнього та професійного характеру. Усвідомлюючи специфіку задач та навчальних ситуацій, здобувач освіти демонструє здатність здійснювати пошук та вибір їх розв’язання за поданим зразком, аргументувати застосування певного способу розв’язання задачі. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку. 70-50 балів - атестований з оцінкою «задовільно» - Задовільний рівень: окреслює володіння поняттєвим та категорійним апаратом навчальної дисципліни на середньому рівні, часткове усвідомлення навчальних і професійних задач, завдань і ситуацій, знання про способи розв’язання типових задач і завдань. Здобувач освіти демонструє середній рівень умінь і навичок застосування знань на практиці, а розв’язання задач потребує допомоги, опори на зразок. В основу навчальної діяльності покладено ситуативність та евристичність, домінування мотивів обов’язку, неусвідомлене застосування можливостей для саморозвитку. 49-00 балів - атестований з оцінкою «незадовільно» - Незадовільний рівень: свідчить про елементарне володіння поняттєвим та категорійним апаратом навчальної дисципліни, загальне уявлення про зміст навчального матеріалу, часткове використання знань, умінь і навичок. В основу навчальної діяльності покладено ситуативно-прагматичний інтерес.
Рекомендована література: 1. Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, 4th edition, Pearson, 2020. - 1136 p.
2. Richard S. Sutton, Andrew G. Barto, Reinforcement Learning: An Introduction, A Bradford Book, 2 ed., MIT Press, Cambridge, MA, 2018. - 322 p.
3. Multiagent Systems, by Gerhard Weiss (Editor), 2nd edition, The MIT Press, 2013. - 920 p.
4. Adrian A. Hopgood, Intelligent Systems for Engineers and Scientists: A Practical Guide to Artificial Intelligence, 4th ed., CRC Press, 2021. – 515 p.
5. Narendra, K. and Thathachar, M. A. L., Learning Automata: An Introduction, 2nd ed., Dover Publications, 2013. - 496 p.
6. K. Najim, A.S. Poznyak, Learning Automata: Theory and Applications, Elsevier, 2014. – 236 p.
7. Chowdhary, Chiranji Lal, Intelligent systems: advances in biometric systems, soft computing, image processing, and data analytics, Apple Academic Press, 2020. – 320 p.
8. Maxim Lapan, Deep Reinforcement Learning Hands-On, 2nd edition, Packt Publishing, 2020. - 798 p.
9. Richard E. Neapolitan, Xia Jiang, Artificial Intelligence: With an Introduction to Machine Learning, Chapman and Hall, 2018. - 480 p.
10. Laurence Moroney, AI and Machine Learning for Coders: A Programmer's Guide to Artificial Intelligence, O'Reilly Media, 2020. - 390 p.
11. Leon Reznik, Intelligent Security Systems: How Artificial Intelligence, Machine Learning and Data Science Work For and Against Computer Security, Wiley-IEEE Press, 2021. – 371 p.
12. Artificial Intelligence-based Internet of Things Systems, Souvik Pal, Debashis De, Rajkumar Buyya (eds.), Springer, 2022. – 513 p.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою:
вул. Карпінського, 2/4, І-й н.к., кімн. 112
E-mail: nolimits@lpnu.ua
Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).