Інтелектуальний аналіз даних

Спеціальність: Інженерія програмного забезпечення (освітньо-наукова програма)
Код дисципліни: 7.121.02.E.025
Кількість кредитів: 5.00
Кафедра: Програмне забезпечення
Лектор: Грицюк Юрій Іванович
Семестр: 2 семестр
Форма навчання: денна
Мета вивчення дисципліни: Забезпечення студентів як фундаментальною теорією, так і практичною реалізацією щодо аналізу та опрацювання великих обсягів інформації, видобування потрібних знань з великих баз даних.
Завдання: Здатність ефективно розв'язувати спеціалізовані задачі та практичні проблеми інноваційного характеру під час професійної діяльності, пов'язаної зі всіма особливостями виробництва програмного забезпечення від початкових стадій створення специфікації вимог до супроводу програмної системи після здачі в експлуатацію. ФКС2.1. Знання сучасних математичних методів та алгоритмів технології Data Mining для аналізу та опрацювання великих обсягів інформації, які використовуються інженерії програмного забезпечення.
Результати навчання: РНС2.1. Вміти розробляти методи аналізу та опрацювання великих обсягів інформації з використанням відомих інструментальних засобів технології Data Mining.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Пререквізити: Опрацювання зображень методами штучного інтелекту Кореквізити: Виконання та захист магістерської кваліфікаційної роботи
Короткий зміст навчальної програми: Дисципліна передбачає вивчення основних понять технології Data Mining, детально розглядаються методи, інструментальні засоби і застосування Data Mining. Опис кожного методу супроводжується конкретним прикладом його використовування. Вводиться поняття Web Mining. Аналізується ринок аналітичного програмного забезпечення, описуються продукти від провідних виробників Data Mining, обговорюються їх можливості. Особлива увага зосереджена на технології аналізу даних Data Mining, Text Mining, Visual Mining, а також розглядається візуальний (Visual Mining) і текстовий (Text Mining) аналіз даних, аналіз процесів (Process Mining), аналіз Web-ресурсів (Web mining) і аналіз в режимі реального часу (Real-Time Data Mining). Наведено опис методів і алгоритмів вирішення основних завдань аналізу: класифікації, кластеризації та ін. Опис ідеї кожного методу доповнюється конкретним прикладом його використання.
Опис: 1. Вступ. Потреба організації інтелектуальних обчислень. Особливості застосування технології Data Mining. Технологія Data Mining та український ринок її користувачів. 2. Інтелектуальний аналіз даних. Поняття про видобування даних – Data Mining. Основні завдання Data Mining під час аналізу набору даних. Практичне застосування методів і засобів Data Mining. Моделі і методи Data Mining. Процес виявлення знань в наборах даних. Управління знаннями (Knowledge Management). Засоби Data Mining для оброблення набору даних. 3. Поняття про класифікацію та регресію об'єктів. Постановка завдання класифікації та регресії. Подання результатів класифікації та регресії. Методи побудови правил класифікації, дерев рішень, математичних функцій. Прогнозування часових рядів. Кладистика – спеціальний підхід до біологічної класифікації. 4. Особливості пошуку асоціативних правил. Постановка завдання пошуку асоціативних правил. Подання результатів пошуку асоціативних правил. Алгоритми пошуку асоціативних правил. 5. Поняття про кластерний аналіз та кластеризацію. Постановка завдання кластеризації. Подання результатів кластеризації. Базові алгоритми кластеризації. Адаптивні методи кластеризації даних. 6. Візуальний аналіз даних – Visual Mining. Проблеми виконання візуального аналізу даних. Інструментальні засоби візуалізації даних. Методи візуалізації даних. Візуалізація як спосіб розуміння змісту даних. 7. Інтелектуальний аналіз текстів – Text Mining. Завдання аналізу текстів. Видобування ключових понять з тексту. Класифікація текстових документів. Методи кластеризації текстових документів. Завдання анотування текстів. Засоби аналізу текстової інформації. 8. Видобування знань з Web – Web Mining. Методи видобування Web-контента. Видобування Web-структур. Дослідження використання WEB-ресурсів. 9. Засоби аналізу процесів – Process Mining. Автоматизація виконання бізнес-процесів. Аналіз процесів. Методи Process Mining. Бібліотека алгоритмів Process Mining – PROM. 10. Розподілений аналіз даних. Системи мобільних агентів. Використання мобільних агентів для аналізу даних. Система аналізу розподілених даних. 11. Data Mining у реальному часі (Real-Time Data Mining). Ідея Data Mining у реальному часі. Рекомендаційні машини. Інструменти Data Mining у реальному часі. 12. Стандарти Data Mining. Коротко про стандарти. Стандарт CWM. Стандарт CRISP. Стандарт PMML. Інші стандарти Data Mining. 13. Бібліотека Xelopes. Архітектура бібліотеки. Діаграма Model. Діаграма Settings. Діаграма Attribute. Діаграма Algorithms. Діаграма DataAccess. Діаграма Transformation. Приклади використання бібліотеки Xelopes. 14. Особливості та ефективність генетичних алгоритмів для оброблення великих даних. Класифікація генетичних алгоритмів. Сутність й класифікація еволюційних алгоритмів: базовий ГА; послідовні та паралельні модифікації базового ГА. Особливості застосування генетичних алгоритмів, передумови для адаптації. Класифікація адаптивних генетичних алгоритмів: основа та область адаптації, основа управління адаптацією. Двонаправлена інтеграція генетичних алгоритмів і нечітких алгоритмів продукційного типу.
Методи та критерії оцінювання: 1. Усне опитування на лабораторних заняттях. 2. Контрольні тести на лабораторних заняттях. 3. Захист лабораторних робіт. 4. Екзаменаційний контроль (письмова компонента (тести), усна компонента).
Критерії оцінювання результатів навчання: 1. Лабораторні роботи – 35 балів 2. Контрольні тести на лабораторних заняттях – 10 балів Разом за ПК – 45 балів Екзаменаційний контроль: 55% (письмова компонента 50%, усна компонента 5%) На виконання кожної лабораторної роботи виділено по два тижні від початку навчального процесу. Якщо лабораторну роботу студент захищає невчасно, то з кожним відтермінованим тижнем захисту максимальний бал за роботу зменшується на 1.
Порядок та критерії виставляння балів та оцінок: 100–88 балів – («відмінно») виставляється за високий рівень знань (допускаються деякі неточності) навчального матеріалу компонента, що міститься в основних і додаткових рекомендованих літературних джерелах, вміння аналізувати явища, які вивчаються, у їхньому взаємозв’язку і роз витку, чітко, лаконічно, логічно, послідовно відповідати на поставлені запитання, вміння застосовувати теоретичні положення під час розв’язання практичних задач; 87–71 бал – («добре») виставляється за загалом правильне розуміння навчального матеріалу компонента, включаючи розрахунки , аргументовані відповіді на поставлені запитання, які, однак, містять певні (неістотні) недоліки, за вміння застосовувати теоретичні положення під час розв’язання практичних задач; 70 – 50 балів – («задовільно») виставляється за слабкі знання навчального матеріалу компонента, неточні або мало аргументовані відповіді, з порушенням послідовності викладення, за слабке застосування теоретичних положень під час розв’язання практичних задач; 49–26 балів – («не атестований» з можливістю повторного складання семестрового контролю) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння застосувати теоретичні положення під час розв’язання практичних задач; 25–00 балів – («незадовільно» з обов’язковим повторним вивченням) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння орієнтуватися під час розв’язання практичних задач, незнання основних фундаментальних положень.
Рекомендована література: 1. ЕНМК з дисципліни "Інтелектуальний аналіз даних" сертифікат № 04498. Доступний з : https://vns.lpnu.ua/course/view.php?id=4785 2. Грицюк Ю.І. Інтелектуальний аналіз даних і процесів : навч. посібник / Ю. І. Грицюк. – Львів : Вид-во НУ "Львівська політехніка", 2018. – 440 с. (рукопис) 3. Грицюк Ю.І. Інтелектуальний аналіз даних : лаборат. практикум / Ю. І. Грицюк. – Львів : Вид-во НУ "Львівська політехніка", 2016. – 160 с. (рукопис) 4. Грицюк Ю.І. Обчислювальні методи та моделі в наукових дослідженнях : монографія / Ю.І. Грицюк. – Львів : Вид-во ЛДУ БЖД, 2014. – 288 с.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою: вул. Карпінського, 2/4, І-й н.к., кімн. 112 E-mail: nolimits@lpnu.ua Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).