Інформаційна система рекомендації велосипедів на основі відкритих даних
Автор: Зубрицький Роман Любомирович
Кваліфікаційний рівень: магістр
Спеціальність: Інформаційні системи та технології
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: Протягом останніх декількох років в Україні стабільно зростає популярність велосипедів, як для повсякденних поїздок, так і для розваг. Дану тенденцію підтверджують підрахунки велосипедистів, які проводять різноманітні громадські організації [1], та соціологічні дослідження щодо пересування громадян містом [2]. Одним з найголовніших поштовхів зацікавленості до велосипедів стала пандемія 2020 року, адже люди почали використовувати велосипеди через часткове або повне припинення роботи громадського транспорту чи з метою зменшення кількості контактів з іншими людьми [3]. Але навіть попри те, що на початку пандемії продажі велосипедів зросли у понад два рази, кількість велосипедів продовжує стабільно зростати. За підрахунками організації U-Cycle, від осені 2020 року до осені 2022 року кількість велосипедистів зросла приблизно на 14% [4]. А за даними Державної служби статистики України, у 2023 році в Україні було зареєстровано 1,5 мільйона велосипедів [5]. Це ще на 10% більше, ніж у 2022 році. У зв’язку з таким трендом, створення онлайн магазинів з продажу велосипедів стало досить перспективним і прибутковим бізнесом. А для того, щоб полегшити вибір велосипеда для новачків, почали появлятися різноманітні рекомендаційні системи [6], які можуть функціонувати як незалежно, так і на базі онлайн магазинів. Саме ці причини і вказують на те, що реалізація вибраної теми є доцільною та актуальною. Для того, щоб детально дослідити тему та розглянути системи-аналоги, здійснено огляд літературних джерел та різноманітних джерел з мережі Інтернет. У результаті було визначено, що розробка системи з рекомендацій велосипедів є актуальною, оскільки в таких системах є потреба, а способи рекомендацій збільшуються з року в рік. Так було досліджено, що із значним розвитком великих мовних моделей їх також можна застосовувати для генерації рекомендацій. У ході виконання системного аналізу інформаційної системи було побудовано дерево цілей на основі її головної мети та застосовано метод аналізу ієрархій, в результаті якого було визначено тип проектованої інформаційної системи – інформаційно-рекомендаційна. Крім цього, було описано головне призначення системи та ефект, який вона принесе. Також за допомогою кейс засобу Visual Paradigm було створено концептуальну модель системи у вигляді набору UML діаграм. При виборі методів та засобів реалізації системи було розглянуто специфіку побудови ETL процесів, виконання веб скрейпінгу, та техніки інженерії підказок (prompt engineering) для великих мовних моделей. Також було здійснено підбір технологій та інструментів для розв?язання задачі. Для цього було виконано аналіз мов програмування та їх фреймворків за допомогою яких можна створити систему. Як результат - було вибрано мову програмування Python і його фреймворки Airflow, Beautiful Soup, Pandas, SQLAlchemy та Flask, а в якості системи управління базами даних було обрано PostgreSQL. Вибір цих засобів було детально обґрунтовано. Після всіх підготовчих кроків було виконано програмну реалізацію інформаційної системи рекомендацій велосипедів. Для цього спочатку було створено ETL процес, який спочатку розгортає базу даних, а потім за допомогою веб скрейпінгу наповнює її так, щоб дані були чистими та структурованими. Також було реалізовано та описано реалізацію веб-додатку системи, яка рекомендує велосипеди за допомогою великої мовної моделі, натренованої на відкритих даних. Об?єктом дослідження є процес створення рекомендацій велосипедів в мережі Інтернет. Предметом дослідження є інформаційна система рекомендації велосипедів, яка використовує відкриті дані. Мета дослідження. Метою даної роботи являється створення інформаційної системи рекомендації велосипедів на основі відкритих даних. Результатом дослідження являється розроблений веб-додаток для надання рекомендацій велосипедів, відлагоджений процес збору, обробки та зберігання даних які використовуються в системі. Ключові слова: велосипеди, підбір велосипедів, інформаційна система, рекомендаційна система, веб скрейпінг, великі мовні моделі. Перелік використаних літературних джерел. 1. Звіт про підрахунок велосипедистів у Києві (осінь 2020). [Електронний ресурс] - Режим доступу: https://u-cycle.org.ua/news/rezul-taty-pidrakhunku-velosypedystiv-u-kyievi-osin-2020/ 2. «Як мешканці пересуваються містом?» [Електронний ресурс] - Режим доступу: https://docs.google.com/document/d/1X_TN0fUYTPLxDaJnuU34BbB3L0LXu_dpERmYspXU_8k/edit 3. «Під час карантину кількість велосипедистів зросла у понад 2,5 рази» [Електронний ресурс] - Режим доступу: https://glavcom.ua/kyiv/news/pid-chas-karantinu-kilkist-velosipedistiv-u-kijevi-zrosla-uponad-25-razi-676853.html 4. Звіт про підрахунок велосипедистів у Києві (осінь 2022). [Електронний ресурс] - Режим доступу: https://u-cycle.org.ua/news/bil-she-polovyny-velosypedystiv-u-kyievi-izdyt-po-dorozi-ta-veloinfrastrukturi/ 5. Державна служба статистики України [Електронний ресурс] - Режим доступу: https://ukrstat.gov.ua/ 6. Recommendation System -Understanding The Basic Concepts [Електронний ресурс] – Режим доступу: https://www.analyticsvidhya.com/blog/2021/07/recommendation-system-understanding-the-basic-concepts