Статистичні методи аналізу даних

Спеціальність: Інженерія програмного забезпечення
Код дисципліни: 6.121.03.E.057
Кількість кредитів: 6.00
Кафедра: Програмне забезпечення
Лектор: Гавриш Василь Іванович
Семестр: 5 семестр
Форма навчання: денна
Мета вивчення дисципліни: Основною метою вивчення навчальної дисципліни є формування у студентів базових математичних знань для розв’язування задач у професійній діяльності, вмінь аналітичного мислення та математичного формулювання технічних задач. Статистичні методи аналізу даних є важливою дисципліною спеціальності 121 „Інженерія програмного забезпечення”. Вона викладається з метою навчити студентів: досліджувати статистичні дискретні та інтервальні ряди експериментальних даних, визначати їх числові параметри і виконувати геометричне зображення; визначати точкові та інтервальні оцінки параметрів розподілу статистичних вибірок даних; досліджувати вплив різних факторів на результати вимірювання експериментальних даних; визначати кореляційний зв’язок між сумісно виміряними величинами із використанням експериментальних даних; встановлювати форму цього зв’язку із використанням лінійних та нелінійних регресійних залежностей.
Завдання: У результаті вивчення дисципліни студент повинен бути здатним продемонструвати такі результати навчання: 1) аналізувати дискретні та інтервальні статистичні ряди експериментальних даних; 2) визначати їх основні числові параметри; 3) виконувати їх геометричне зображення; 4) досліджувати вплив факторів на результати експериментів та вимірювань із використанням дисперсійного аналізу; 5) досліджувати кореляційний зв’язок між сумісно виміряними величинами із використанням експериментальних даних; 6) встановлювати форму цього зв’язку , використовуючи методи регресійного аналізу; 7) вміти застосовувати до розв’язування практичних задач пакети Mathematica та Statistika. Вивчення навчальної дисципліни передбачає формування та розвиток у студентів компетентностей: загальних: ІНТ: здатність розв’язувати складні спеціалізовані завдання або практичні проблеми інженерії програмного забезпечення, що характеризуються комплексністю та невизначеністю умов, із застосуванням теорій та методів інформаційних технологій; фахових: ФКС3.1: здатність продемонструвати знання для дослідження впливу факторів на дані результатів експериментів з використанням дисперсійного аналізу, встановлення зв’язку між даними з використанням кореляційного та регресійного аналізу. Результати навчання даної дисципліни деталізують такі програмні результати навчання: 1) здатність продемонструвати знання та розуміння наукових і математичних принципів, що лежать в основі інформаційних технологій; 2) здатність продемонструвати знання та навики щодо збору даних, їх аналізу, опрацювання і моделювання у предметній області.
Результати навчання: У результаті вивчення навчальної дисципліни здобувач освіти повинен бути здатним продемонструвати такі результати навчання: володіння фундаментальними поняттями та їх основними властивостями і практичними навичками використання. У результаті вивчення навчальної дисципліни здобувач освіти повинен бути здатним продемонструвати такі програмні результати навчання: ПР01. Знати і застосовувати на практиці принципи та методи зберігання, видобування та опрацювання даних. ПР06. Вміти використовувати статистичні методи для визначення зв'язку вхідних і вихідних параметрів, аналізу параметрів процесів різної природи, установлення взаємної залежності між різними факторами і результатами процесу.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Попередні дисципліни: теорія ймовірностей та математична статистика ; супутні та наступні дисципліни: технології штучного інтелекту в інженерії даних.
Короткий зміст навчальної програми: Навчальна дисципліна «Статистичні методи аналізу даних» складається з розділів: «Статистичні дискретні та інтервальні ряди даних результатів вимірювань та експериментів, їх геометричне зображення та визначення основних числових параметрів», «Основні теоретичні закони розподілу випадкових величин», «Точкові та інтервальні оцінки параметрів розподілу випадкових величин», «Статистичні гіпотези», «Основи дисперсійного аналізу», «Елементи кореляційного аналізу», «Регресійний аналіз».
Опис: Загальна характеристика статистичних методів опрацювання даних результатів вимірювань і експериментів та їх класифікація. 2. Дискретні статистичні ряди спостережень, функція розподілу та їх графічне зображення. 3. Основні числові параметри статистичних дискретних рядів. 4. Інтервальні статистичні ряди. 5. Основні розподіли випадкових величин: біномний, рівномірний, нормальний, показниковий, Пуассона, Пірсона (хі-квадрат розподіл), Вейбула, “Studenta” (t-розподіл), Фішера-Снедекора. 6. Точкові та інтервальні оцінки параметрів розподілу статисти-них даних. Методи визначення точкових оцінок. Інтервальні оцінки для нормально розподілених статистичних даних. 7. Перевірка статистичних гіпотез. Гіпотеза про розподіл статистичних даних. Критерії Пірсона, Колмогорова та Смірнова. 8. Основи дисперсійного аналізу. Однофакторний та двофакторний дисперсійний аналіз. 9. Основи кореляційного аналізу. Коефіцієнт кореляції, критерій В. Романовського та функція Р. Фішера. 10. Основи регресійного аналізу. Лінійна регресія. Коефіцієнти регресії та методи їх визначення.
Методи та критерії оцінювання: Поточний контроль: виконання та захист лабораторних робіт, виконання практичних завдань, фронтальне та вибіркове усне опитування, оцінка активності внесених пропозицій, оригінальних рішень, уточнень і визначень. Екзаменаційний контроль: письмове та усне опитування, тестовий контроль.
Критерії оцінювання результатів навчання: Навчальна дисципліна завершується семестровим контролем, форма якого передбачена навчальним планом із виставленням семестрової оцінки. Семестрова оцінка складається зі суми балів, передбачених на поточний та екзаменаційний контроль. Цю інформацію викладач доводить студентам на першому занятті з навчальної дисципліни. 1. Бали за поточний контроль виставляють до початку сесії. До екзамену допускаються студенти, які виконали 100% робіт поточного контролю. Студент, який виконав менше 50% робіт поточного контролю, вважається неатестованим та має можливість пройти повторне вивчення дисципліни. Студент, який виконав більше 50% робіт але не всі 100% може довиконати завдання і скласти іспит на комісії. 2. Бали за практичні заняття виставляють згідно письмового опитування та загальної активності на занятті. 3. Бали за лабораторні роботи виставляють згідно успішного захисту. Захист вважають успішним, якщо студент вчасно продемонстрував виконання лабораторної роботи відповідно до свого варіанту завдання, правильно оформив звіт і захистив його та дав правильні відповіді на усні запитання; зміг внести корективи у лабораторну на прохання викладача. Якщо захист лабораторної роботи відбувається невчасно, з кожним тижнем затримки захисту бали за лабораторну зменшуються на 1. 4. Відповідальність за недотримання принципів академічної доброчесності під час виконання і захисту лабораторних робіт: якщо при захисті лабораторної роботи викладачем було виявлено прояви порушення академічної доброчесності, робота не зараховується, студент отримує новий варіант завдання і може повторно захищати лабораторну на мінімальну кількість балів (1 бал).
Порядок та критерії виставляння балів та оцінок: 100–88 балів – («відмінно») виставляється за високий рівень знань (допускаються деякі неточності) навчального матеріалу компонента, що міститься в основних і додаткових рекомендованих літературних джерелах, вміння аналізувати явища, які вивчаються, у їхньому взаємозв’язку і роз витку, чітко, лаконічно, логічно, послідовно відповідати на поставлені запитання, вміння застосовувати теоретичні положення під час розв’язання практичних задач; 87–71 бал – («добре») виставляється за загалом правильне розуміння навчального матеріалу компонента, включаючи розрахунки , аргументовані відповіді на поставлені запитання, які, однак, містять певні (неістотні) недоліки, за вміння застосовувати теоретичні положення під час розв’язання практичних задач; 70 – 50 балів – («задовільно») виставляється за слабкі знання навчального матеріалу компонента, неточні або мало аргументовані відповіді, з порушенням послідовності викладення, за слабке застосування теоретичних положень під час розв’язання практичних задач; 49–26 балів – («не атестований» з можливістю повторного складання семестрового контролю) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння застосувати теоретичні положення під час розв’язання практичних задач; 25–00 балів – («незадовільно» з обов’язковим повторним вивченням) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння орієнтуватися під час розв’язання практичних задач, незнання основних фундаментальних положень.
Рекомендована література: 1. Слюсарчук Ю. М. Теорія ймовірностей, математична статистика та ймовірнісні процеси: навчальний посібник / Ю. М. Слюсарчук, Й. Я. Хром'як, Л. Л. Джавала, В. М. Цимбал – Львів : Видавництво Львівської політехніки, 2015. – 364 с. 2. Бахрушин В. Є. Методи аналізу даних : навчальний посібник для студентів / В. Є. Бахрушин. – Запоріжжя : КПУ, 2011. – 268 с. ISBN 978-966-414-103-8. 3. В. В. Барковський. Теорія ймовірностей та математична статистика: навч. посібник / В. В. Барковський, Н. В. Барковська, О. К. Лопатін. – 5-те видання. – К. : Центр учбової літератури, 2010. – 424 с. 4. Єлейко Я. І. Теорія ймовірностей. Теореми, приклади і задачі : навч.-метод. посібник / Я. І. Єлейко, Б. І. Копитко, Б. М. Тріщ. – Львів. Видавн. центр ЛНУ імені Івана Франка, 2009. – 260 с. 5. B.L. van der Waerden. Mathematical Statistics. – London: George Allen & Unwin Ltd. : Springer-Verlag Berlin Heidelberg GmbH; Softcover reprint of the original 1st ed. 1969 edition, 1960. – 382 p. 6. Електронний навчально-методичний комплекс “ Статистичні методи аналізу даних ”: Адреса розміщення: http: // vns.lpnu.edu.ua/course / view. php?id=4767. 7. Principal Components and Factor Analysis [Електронний ресурс]. – Режим доступу : http://www.fmi.uni-sofia.bg/fmi/statist/education/textbook/eng/stfacan.html. 8. Factor Analysis: Statistical Methods and Practical Issues (Quantitative Applications in the Social Sciences) [Електронний ресурс]. – Режим доступу : https://www.amazon.com/gp/product/0803911661/ref=pd_sim_14_2?ie=UTF8&pd_rd_i=0803911661&pd_rd_r=G 2FAYKQMVC1BG7863C1D&pd_rd_w=bnkFs&pd_rd_wg=vfAyn&psc=1&refRID=G2FAYKQMVC1BG7863C 1D.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою: вул. Карпінського, 2/4, І-й н.к., кімн. 112 E-mail: nolimits@lpnu.ua Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).