Статистичні методи аналізу даних
Спеціальність: Інженерія програмного забезпечення
Код дисципліни: 6.121.03.E.057
Кількість кредитів: 6.00
Кафедра: Програмне забезпечення
Лектор: Гавриш Василь Іванович
Семестр: 5 семестр
Форма навчання: денна
Завдання: У результаті вивчення дисципліни студент повинен бути здатним продемонструвати такі результати навчання:
1) аналізувати дискретні та інтервальні статистичні ряди експериментальних даних;
2) визначати їх основні числові параметри;
3) виконувати їх геометричне зображення;
4) досліджувати вплив факторів на результати експериментів та вимірювань із використанням дисперсійного аналізу;
5) досліджувати кореляційний зв’язок між сумісно виміряними величинами із використанням експериментальних даних;
6) встановлювати форму цього зв’язку , використовуючи методи регресійного аналізу;
7) вміти застосовувати до розв’язування практичних задач пакети Mathematica та Statistika.
Вивчення навчальної дисципліни передбачає формування та розвиток у студентів компетентностей:
загальних:
ІНТ: здатність розв’язувати складні спеціалізовані завдання або практичні проблеми інженерії програмного забезпечення, що характеризуються комплексністю та невизначеністю умов, із застосуванням теорій та методів інформаційних технологій;
фахових:
ФКС3.1: здатність продемонструвати знання для дослідження впливу факторів на дані результатів експериментів з використанням дисперсійного аналізу, встановлення зв’язку між даними з використанням кореляційного та регресійного аналізу.
Результати навчання даної дисципліни деталізують такі програмні результати навчання:
1) здатність продемонструвати знання та розуміння наукових і математичних принципів, що лежать в основі інформаційних технологій;
2) здатність продемонструвати знання та навики щодо збору даних, їх аналізу, опрацювання і моделювання у предметній області.
Результати навчання: У результаті вивчення навчальної дисципліни здобувач освіти повинен бути здатним продемонструвати такі результати навчання: володіння фундаментальними поняттями та їх основними властивостями і практичними навичками використання.
У результаті вивчення навчальної дисципліни здобувач освіти повинен бути здатним продемонструвати такі програмні результати навчання:
ПР01. Знати і застосовувати на практиці принципи та методи зберігання, видобування та опрацювання даних.
ПР06. Вміти використовувати статистичні методи для визначення
зв'язку вхідних і вихідних параметрів, аналізу параметрів процесів різної природи, установлення взаємної залежності між різними факторами і результатами процесу.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Попередні дисципліни: теорія ймовірностей та математична статистика ;
супутні та наступні дисципліни: технології штучного інтелекту в інженерії даних.
Короткий зміст навчальної програми: Навчальна дисципліна «Статистичні методи аналізу даних» складається з розділів: «Статистичні дискретні та інтервальні ряди даних результатів вимірювань та експериментів, їх геометричне зображення та визначення основних числових параметрів», «Основні теоретичні закони розподілу випадкових величин», «Точкові та інтервальні оцінки параметрів розподілу випадкових величин», «Статистичні гіпотези», «Основи дисперсійного аналізу», «Елементи кореляційного аналізу», «Регресійний аналіз».
Опис: Загальна характеристика статистичних методів опрацювання даних результатів вимірювань і експериментів та їх класифікація.
2. Дискретні статистичні ряди спостережень, функція розподілу та їх графічне зображення.
3. Основні числові параметри статистичних дискретних рядів.
4. Інтервальні статистичні ряди.
5. Основні розподіли випадкових величин: біномний, рівномірний, нормальний, показниковий, Пуассона, Пірсона (хі-квадрат розподіл), Вейбула, “Studenta” (t-розподіл), Фішера-Снедекора.
6. Точкові та інтервальні оцінки параметрів розподілу статисти-них даних. Методи визначення точкових оцінок. Інтервальні оцінки для нормально розподілених статистичних даних.
7. Перевірка статистичних гіпотез. Гіпотеза про розподіл статистичних даних. Критерії Пірсона, Колмогорова та Смірнова.
8. Основи дисперсійного аналізу. Однофакторний та двофакторний дисперсійний аналіз.
9. Основи кореляційного аналізу. Коефіцієнт кореляції, критерій В. Романовського та функція Р. Фішера.
10. Основи регресійного аналізу. Лінійна регресія. Коефіцієнти регресії та методи їх визначення.
Методи та критерії оцінювання: Поточний контроль: виконання та захист лабораторних робіт, виконання практичних завдань, фронтальне та вибіркове усне опитування, оцінка активності внесених пропозицій, оригінальних рішень, уточнень і визначень. Екзаменаційний контроль: письмове та усне опитування, тестовий контроль.
Критерії оцінювання результатів навчання: Навчальна дисципліна завершується семестровим контролем, форма якого передбачена навчальним планом із виставленням семестрової оцінки.
Семестрова оцінка складається зі суми балів, передбачених на поточний та екзаменаційний контроль. Цю інформацію викладач доводить студентам на першому занятті з навчальної дисципліни.
1. Бали за поточний контроль виставляють до початку сесії. До екзамену допускаються студенти, які виконали 100% робіт поточного контролю. Студент, який виконав менше 50% робіт поточного контролю, вважається неатестованим та має можливість пройти повторне вивчення дисципліни. Студент, який виконав більше 50% робіт але не всі 100% може довиконати завдання і скласти іспит на комісії.
2. Бали за практичні заняття виставляють згідно письмового опитування та загальної активності на занятті.
3. Бали за лабораторні роботи виставляють згідно успішного захисту. Захист вважають успішним, якщо студент вчасно продемонстрував виконання лабораторної роботи відповідно до свого варіанту завдання, правильно оформив звіт і захистив його та дав правильні відповіді на усні запитання; зміг внести корективи у лабораторну на прохання викладача. Якщо захист лабораторної роботи відбувається невчасно, з кожним тижнем затримки захисту бали за лабораторну зменшуються на 1.
4. Відповідальність за недотримання принципів академічної доброчесності під час виконання і захисту лабораторних робіт: якщо при захисті лабораторної роботи викладачем було виявлено прояви порушення академічної доброчесності, робота не зараховується, студент отримує новий варіант завдання і може повторно захищати лабораторну на мінімальну кількість балів (1 бал).
Порядок та критерії виставляння балів та оцінок: 100-88 балів - атестований з оцінкою «відмінно» - Високий рівень: здобувач освіти демонструє поглиблене володіння поняттєвим та категорійним апаратом навчальної дисципліни, системні знання, вміння і навички їх практичного застосування. Освоєні знання, вміння і навички забезпечують можливість самостійного формулювання цілей та організації навчальної діяльності, пошуку та знаходження рішень у нестандартних, нетипових навчальних і професійних ситуаціях. Здобувач освіти демонструє здатність робити узагальнення на основі критичного аналізу фактичного матеріалу, ідей, теорій і концепцій, формулювати на їх основі висновки. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку, самостійної науково-дослідної діяльності, що реалізується за підтримки та під керівництвом викладача. 87-71 балів - атестований з оцінкою «добре» - Достатній рівень: передбачає володіння поняттєвим та категорійним апаратом навчальної дисципліни на підвищеному рівні, усвідомлене використання знань, умінь і навичок з метою розкриття суті питання. Володіння частково-структурованим комплексом знань забезпечує можливість їх застосування у знайомих ситуаціях освітнього та професійного характеру. Усвідомлюючи специфіку задач та навчальних ситуацій, здобувач освіти демонструє здатність здійснювати пошук та вибір їх розв’язання за поданим зразком, аргументувати застосування певного способу розв’язання задачі. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку. 70-50 балів - атестований з оцінкою «задовільно» - Задовільний рівень: окреслює володіння поняттєвим та категорійним апаратом навчальної дисципліни на середньому рівні, часткове усвідомлення навчальних і професійних задач, завдань і ситуацій, знання про способи розв’язання типових задач і завдань. Здобувач освіти демонструє середній рівень умінь і навичок застосування знань на практиці, а розв’язання задач потребує допомоги, опори на зразок. В основу навчальної діяльності покладено ситуативність та евристичність, домінування мотивів обов’язку, неусвідомлене застосування можливостей для саморозвитку. 49-00 балів - атестований з оцінкою «незадовільно» - Незадовільний рівень: свідчить про елементарне володіння поняттєвим та категорійним апаратом навчальної дисципліни, загальне уявлення про зміст навчального матеріалу, часткове використання знань, умінь і навичок. В основу навчальної діяльності покладено ситуативно-прагматичний інтерес.
Рекомендована література: 1. Слюсарчук Ю. М. Теорія ймовірностей, математична статистика та ймовірнісні процеси: навчальний посібник / Ю. М. Слюсарчук, Й. Я. Хром'як, Л. Л. Джавала, В. М. Цимбал – Львів : Видавництво Львівської політехніки, 2015. – 364 с.
2. Бахрушин В. Є. Методи аналізу даних : навчальний посібник для студентів / В. Є. Бахрушин. – Запоріжжя : КПУ, 2011. – 268 с. ISBN 978-966-414-103-8.
3. В. В. Барковський. Теорія ймовірностей та математична статистика: навч. посібник / В. В. Барковський, Н. В. Барковська, О. К. Лопатін. – 5-те видання. – К. : Центр учбової літератури, 2010. – 424 с.
4. Єлейко Я. І. Теорія ймовірностей. Теореми, приклади і задачі : навч.-метод. посібник / Я. І. Єлейко, Б. І. Копитко, Б. М. Тріщ. – Львів. Видавн. центр ЛНУ імені Івана Франка, 2009. – 260 с.
5. B.L. van der Waerden. Mathematical Statistics. – London: George Allen & Unwin Ltd. : Springer-Verlag Berlin Heidelberg GmbH; Softcover reprint of the original 1st ed. 1969 edition, 1960. – 382 p.
6. Електронний навчально-методичний комплекс “ Статистичні методи аналізу даних ”: Адреса розміщення: http: // vns.lpnu.edu.ua/course / view. php?id=4767.
7. Principal Components and Factor Analysis [Електронний ресурс]. – Режим доступу :
http://www.fmi.uni-sofia.bg/fmi/statist/education/textbook/eng/stfacan.html.
8. Factor Analysis: Statistical Methods and Practical Issues (Quantitative Applications in the
Social Sciences) [Електронний ресурс]. – Режим доступу :
https://www.amazon.com/gp/product/0803911661/ref=pd_sim_14_2?ie=UTF8&pd_rd_i=0803911661&pd_rd_r=G
2FAYKQMVC1BG7863C1D&pd_rd_w=bnkFs&pd_rd_wg=vfAyn&psc=1&refRID=G2FAYKQMVC1BG7863C
1D.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою:
вул. Карпінського, 2/4, І-й н.к., кімн. 112
E-mail: nolimits@lpnu.ua
Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).