Проєкт інформаційної системи із парсингу даних для процедур прогнозування результатів спортивних подій

Автор: Кемпник Роман Васильович
Кваліфікаційний рівень: магістр
Спеціальність: Управління ІТ проектами
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: У сучасному світі інформаційні системи відіграють ключову роль у зборі, аналізі та обробці даних. Особливо це стосується спортивної аналітики, де обсяги доступної інформації зростають із кожним роком. Завдяки розвитку технологій стало можливим автоматизувати процеси збору даних із різних джерел, таких як спортивні сайти, бази даних і API. Ця автоматизація відкриває нові перспективи для прогнозування спортивних подій, що є особливо важливим у зв’язку з популяризацією ставок на спорт, спортивної журналістики та аналізу стану команд. Спорт є однією зі сфер, де обробка і аналіз великих даних можуть принести користь тим, хто зможе ними скористатися, оскільки передбачення результатів спортивних подій стало важливим інструментом для численних зацікавлених сторін – від спортивних аналітиків і журналістів до любителів спорту і букмекерських компаній [3]. Прогнозування результатів спортивних подій вимагає врахування багатьох факторів: від історичних показників команд і статистики гравців до таких змінних, як погодні умови чи місце проведення матчу. Ці параметри є надзвичайно важливими для формування точних прогнозів, що дають користувачам змогу приймати більш обґрунтовані рішення. У той же час розробка подібних інформаційних систем є актуальною через постійну динамічність і мінливість спортивної галузі. Крім того, деякі з параметрів мають високу ймовірність зміни і стають більш визначеними ближче до старту спортивної події, коли вже залишається мало часу для проведення обчислень на основі щойно оновлених даних. Також проблема ручного збору й обробки даних стає дедалі більшою через складність інтеграції різних форматів інформації. Саме тому автоматизація та впровадження новітніх алгоритмів аналізу, таких як метод Монте-Карло та алгоритми машинного навчання, дозволяють розв’язати ці виклики [4]. Інформаційні системи для парсингу даних дають змогу забезпечити аналітиків, букмекерів та спортивних фанатів якісними прогнозами та швидким доступом до актуальної інформації. Мета роботи полягає у розробці системи, яка здатна автоматизовано отримувати дані з численних джерел (веб-сайтів, баз даних, API), обробляти їх, зводити до уніфікованої форми та забезпечувати якісне прогнозування спортивних результатів. Це дозволяє підвищити точність прогнозів і приймати обґрунтовані рішення, що є актуальним для зацікавлених сторін. Об’єктом дослідження є процеси збору, обробки та аналізу даних, що потенційно впливають на результат спортивних змагань. Предметом дослідження є методи та засоби, які дозволяють підвищити точність прогнозів, забезпечуючи ефективний і своєчасний збір даних з різноманітних джерел з метою їх подальшого використання у алгоритмах прогнозування результатів спортивних подій. Наукова новизна роботи полягає у створенні системи, яка об’єднує алгоритми машинного навчання, метод Монте-Карло та сучасні технології парсингу для вирішення завдань спортивного прогнозування. Завдяки цьому можливо враховувати складні залежності між параметрами, що впливають на результат спортивної події. Практичне значення одержаних результатів. Система дозволить аналітикам, беттерам та іншим зацікавленим сторонам швидко та у зручний спосіб отримувати прогнози високої точності. Вона знизить затрати часу на обробку даних і підвищить ефективність прийняття рішень. Крім того, додаткова функція формування коротких дайджестів новин забезпечить зручний доступ до релевантної інформації про команди, спортсменів чи змагання. Під час написання цієї магістерської кваліфікаційної роботи було проведено аналіз наявних методів та засобів розв’язання поставленої проблеми, а також описано їхні недоліки, які потрібно покращити. За результатами проведеного системного аналізу і створення UML-діаграм сформовано вимоги до системи й розроблено її концептуальну модель. Після цього складено план керування проєктом. На основі проведеної роботи було реалізовано інформаційну систему із парсингу даних для процедур прогнозування результатів спортивних подій у вигляді веб-сторінки під назвою “Predict sport event”, що може використовуватися зацікавленими людбми для отримання точних передбачень спортивних подій. Ключові слова: інформаційна система, парсинг даних, прогнозування результатів спортивних подій, машинне навчання, метод Монте-Карло, спортивна аналітика. Перелік використаних літературних джерел. 3. Analyzing and Exploring the Impact of Big Data Analytics in Sports Sector. Листопад, 2024. URL: https://www.researchgate.net/publication/350544331_Analyzing_and_Exploring_the_Impact_of_Big_Data_Analytics_in_Sports_Sector. 4. ІНФОРМАЦІЙНА СИСТЕМА ІЗ ПАРСИНГУ ДАНИХ ДЛЯ ПРОЦЕДУР ПРОГНОЗУВАННЯ РЕЗУЛЬТАТІВ СПОРТИВНИХ ПОДІЙ / Кемпник Роман Васильович, Басюк Тарас Михайлович // XIII Міжнародна науково-практична конференція «Cultural and artistic processes in the context of the European scientific space». С. 316-318.