Інтелектуальний аналіз даних

Спеціальність: Інженерія програмного забезпечення (освітньо-наукова програма)
Код дисципліни: 7.121.02.E.024
Кількість кредитів: 6.00
Кафедра: Програмне забезпечення
Лектор: д-р техн. наук, проф. Грицюк Юрій Іванович
Семестр: 2 семестр
Форма навчання: денна
Мета вивчення дисципліни: Забезпечення студентів як фундаментальною теорією, так і практичною реалізацією щодо аналізу та опрацювання великих обсягів інформації, видобування потрібних знань з великих баз даних.
Завдання: Здатність ефективно розв’язувати спеціалізовані задачі та практичні проблеми інноваційного характеру під час професійної діяльності, пов’язаної зі всіма особливостями виробництва програмного забезпечення від початкових стадій створення специфікації вимог до супроводу програмної системи після здачі в експлуатацію. Знання сучасних математичних методів та алгоритмів технології Data Mining для аналізу та опрацювання великих обсягів інформації, які використовуються інженерії програмного забезпечення (ФКС2.1).
Результати навчання: РНС2.1. Вміти розробляти методи аналізу та опрацювання великих обсягів інформації з використанням відомих інструментальних засобів технології Data Mining.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Пререквізити: Методи та засоби наукових досліджень в інженерії програмного забезпечення Кореквізити: Виконання та захист магістерської кваліфікаційної роботи
Короткий зміст навчальної програми: Дисципліна передбачає вивчення основних понять технології Data Mining, детально розглядаються методи, інструментальні засоби і застосування Data Mining. Опис кожного методу супроводжується конкретним прикладом його використовування. Вводиться поняття Web Mining. Аналізується ринок аналітичного програмного забезпечення, описуються продукти від провідних виробників Data Mining, обговорюються їх можливості. Особлива увага зосереджена на технології аналізу даних Data Mining, Text Mining, Visual Mining, а також розглядається візуальний (Visual Mining) і текстовий (Text Mining) аналіз даних, аналіз процесів (Process Mining), аналіз Web-ресурсів (Web mining) і аналіз в режимі реального часу (Real-Time Data Mining). Наведено опис методів і алгоритмів вирішення основних завдань аналізу: класифікації, кластеризації та ін. Опис ідеї кожного методу доповнюється конкретним прикладом його використання.
Опис: Особливості застосування технології Data Mining. Технологія Data Mining та український ринок її користувачів. Практичне застосування методів і засобів Data Mining. Моделі і методи Data Mining. Процес виявлення знань в наборах даних. Управління знаннями (Knowledge Management). Класифікація та регресія об'єктів. Методи побудови правил класифікації, дерев рішень, математичних функцій. Прогнозування часових рядів. Асоціативні правила. Базові алгоритми кластеризації. Адаптивні методи кластеризації даних. Візуальний аналіз даних – Visual Mining. Проблеми виконання візуального аналізу даних. Інструментальні засоби візуалізації даних. Методи візуалізації даних. Візуалізація як спосіб розуміння змісту даних. Інтелектуальний аналіз текстів – Text Mining. Видобування ключових понять з тексту. Класифікація текстових документів. Методи кластеризації текстових документів. Видобування знань з Web – Web Mining. Методи видобування Web-контента. Засоби аналізу процесів – Process Mining. Бібліотека алгоритмів Process Mining – PROM. Розподілений аналіз даних. Системи мобільних агентів. Data Mining у реальному часі (Real-Time Data Mining). Рекомендаційні машини. Стандарти Data Mining: CWM, CRISP, PMML та інші. Бібліотека Xelopes. Особливості та ефективність генетичних алгоритмів для оброблення великих даних.
Методи та критерії оцінювання: 1. Усне опитування на лабораторних заняттях. 2. Контрольні тести на лабораторних заняттях. 3. Захист лабораторних робіт. 4. Екзаменаційний контроль (письмова компонента (тести), усна компонента).
Критерії оцінювання результатів навчання: Поточний контроль: 45% (лабораторні роботи – 30% (6 лабораторних робіт по 5% кожна), поточні тести на заняттях 15% (2 тести – 5% +10%)) Екзаменаційний контроль: 55% (письмова компонента 50%, усна компонента 5%) На виконання кожної лабораторної роботи виділено по два тижні від початку навчального процесу. Якщо лабораторну роботу студент захищає невчасно, то з кожним відтермінованим тижнем захисту максимальний бал за роботу зменшується на 1.
Порядок та критерії виставляння балів та оцінок: 100–88 балів – («відмінно») виставляється за високий рівень знань (допускаються деякі неточності) навчального матеріалу компонента, що міститься в основних і додаткових рекомендованих літературних джерелах, вміння аналізувати явища, які вивчаються, у їхньому взаємозв’язку і роз витку, чітко, лаконічно, логічно, послідовно відповідати на поставлені запитання, вміння застосовувати теоретичні положення під час розв’язання практичних задач; 87–71 бал – («добре») виставляється за загалом правильне розуміння навчального матеріалу компонента, включаючи розрахунки , аргументовані відповіді на поставлені запитання, які, однак, містять певні (неістотні) недоліки, за вміння застосовувати теоретичні положення під час розв’язання практичних задач; 70 – 50 балів – («задовільно») виставляється за слабкі знання навчального матеріалу компонента, неточні або мало аргументовані відповіді, з порушенням послідовності викладення, за слабке застосування теоретичних положень під час розв’язання практичних задач; 49–26 балів – («не атестований» з можливістю повторного складання семестрового контролю) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння застосувати теоретичні положення під час розв’язання практичних задач; 25–00 балів – («незадовільно» з обов’язковим повторним вивченням) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння орієнтуватися під час розв’язання практичних задач, незнання основних фундаментальних положень.
Рекомендована література: 1. ЕНМК з дисципліни "Інтелектуальний аналіз даних" сертифікат № 04498. Доступний з : https://vns.lpnu.ua/course/view.php?id=4785 2. Грицюк Ю.І. Інтелектуальний аналіз даних і процесів : навч. посібник / Ю. І. Грицюк. – Львів : Вид-во НУ "Львівська політехніка", 2018. – 440 с. (рукопис) 3. Грицюк Ю.І. Інтелектуальний аналіз даних : лаборат. практикум / Ю. І. Грицюк. – Львів : Вид-во НУ "Львівська політехніка", 2016. – 160 с. (рукопис) 4. Грицюк Ю.І. Обчислювальні методи та моделі в наукових дослідженнях : монографія / Ю.І. Грицюк. – Львів : Вид-во ЛДУ БЖД, 2014. – 288 с.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою: вул. Карпінського, 2/4, І-й н.к., кімн. 112 E-mail: nolimits@lpnu.ua Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).