Система аналізу споживчих переваг продуктових товарів

Автор: Серватяк Максим Віталійович
Кваліфікаційний рівень: магістр
Спеціальність: Аналіз даних (Data Science)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Сучасний розвиток інформаційного суспільства тісно пов’язаний із потребою у зборі, обробці та передачі великих обсягів інформації, а також перетворенні інформації на товар, часто значної вартості. Це призвело до глобального переходу від індустріального суспільства до інформаційного. Виникнення Інтернету сприяло зростанню міжнародних комунікацій у різних сферах життя. Процес обробки інформації можна розглядати як технологію, подібно до обробки матеріальних ресурсів. Інформаційні технології передбачають вміння ефективно працювати з даними та обчислювальною технікою. Проблеми узгодженості даних, швидкості виконання запитів та доступу до інформації можуть бути вирішені за допомогою технологій сховищ даних. Важливість цього полягає в необхідності швидкої аналітичної обробки інформації та ефективної організації великих обсягів даних для формування асортименту товарів в Інтернет-магазинах. Для цього використовуються методи виявлення знань у базах даних (KDD), які охоплюють етапи підготовки даних, вибору ознак, очищення, видобування знань, обробки даних та інтерпретації результатів. Аналіз ринкового кошика є процесом виявлення типових шаблонів покупок споживачів. Цей аналіз здійснюється через обробку даних транзакцій для визначення зв’язків між продуктами. Наприклад, досліджується, які товари часто купуються разом. Результати аналізу ринкового кошика допомагають покращити асортимент товарів, їх розміщення в магазинах та збільшити обсяги продажів завдяки пропозиції супутніх товарів. Для виконання задачі аналізу ринкової кошика використовуються асоціативні правила типу «якщо ... то ...». Наприклад, «якщо клієнт купив пиво, то, ймовірно, він купить і чіпси». Кожна покупка вважається транзакцією, на основі великої кількості яких вивчається поведінка клієнтів. Асоціативні правила дозволяють виявляти закономірності між пов’язаними подіями, а ті з них, що перевищують певний поріг підтримки, вважаються значущими. При використанні методу зазвичай обчислюють ймовірність того, що разом з товаром A буде придбано і товар B. Цей підхід також аналізує ситуацію з іншого боку: якщо спочатку купується продукт B, то яка ймовірність того, що продукт A буде у замовленні? Більшість алгоритмів асоціативних моделей формують остаточні оцінки на основі цих двох ймовірностей. При аналізі даних особливу увагу звертають на інформацію про те, які товари є популярними у різних груп користувачів у певні періоди часу. Ця інформація дозволяє більш ефективно планувати закупівлю товарів, проводити рекламні кампанії та економити час. Отже, розробка інформаційної системи для аналізу споживчих переваг є важливим завданням. Мета роботи полягає в створенні інформаційної системи для аналізу споживчих переваг, що сприятиме прийняттю рішень щодо розміщення товарів. Для досягнення цієї мети були визначені такі завдання: 1. аналіз методів і засобів виявлення залежностей у даних; 2. визначення інформаційних потреб для формування асортименту товарів; 3. проектування сховища даних та перенесення даних; 4. розробка прикладної системи для аналізу споживчих переваг. Об’єктом дослідження є процес аналізу даних споживчих переваг. Предметом дослідження є методи виявлення залежностей у даних та асортимент товарів, базуючись на споживчих перевагах. Наукова новизна отриманих результатів: • Розроблено спосіб побудови транзитивних залежностей, що забезпечує одноразове проходження бази даних під час формування залежностей. • Впровадження апріорної інформації про значущість ознак у новому методі дозволяє зменшити обсяг пошуку та час на вилучення правил, а також скоротити кількість отриманих правил. Практичне значення отриманих результатів: На основі запропонованого методу створено програмне забезпечення, яке дозволяє витягувати численні асоціативні правила і вирішувати практичні задачі. Розроблене програмне забезпечення готове до використання в торгових центрах.