Проєкт інформаційної системи у вигляді чат-бота з використанням векторних сховищ даних на базі Large Language Model
Автор: Сіваков Павло Дмитрович
Кваліфікаційний рівень: магістр
Спеціальність: Управління ІТ проектами
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: Великі мовні моделі (Large Language Models, LLM) представляють собою інтегровані системи штучного інтелекту, які навчаються на величезних обсягах текстових даних для вирішення завдань розуміння та генерації мови. Їхня ефективність ґрунтується на глибокому навчанні та рекурентних нейронних мережах, які дозволяють моделям враховувати довгострокові залежності в тексті. Такі масштабні моделі, як GPT (Generative Pre-trained Transformer) від OpenAI, вражають своєю здатністю не лише розуміти мову, але і генерувати високоякісний текст, сприяючи значним технологічним проривам у сферах від автоматичного перекладу до розробки чат-ботів. Поява великих мовних моделей відкрила нові перспективи для розробки інформаційних систем чат-ботів. Ці потужні інструменти розуміння та генерації мови революціонізують способи, якими чат-боти взаємодіють з користувачами, дозволяючи їм наблизитися до природного тону та способу спілкування. Це відкриває нові горизонти для застосування чат-ботів у різних областях, де швидкість та точність комунікації є критично важливими. Поєднуючи потужність великих мовних моделей з ефективністю векторних сховищ даних, ми очікуємо великий стрибок в показниках продуктивності інформаційних систем чат-ботів. Це об’єднання обіцяє покращити користувацький досвід, сприяти більш цікавій та природній взаємодії, а також прокласти шлях для застосування в різних сферах. Крім того, успішне впровадження цієї інформаційної системи чат-ботів може мати далекосяжні наслідки для бізнесу, який прагне оптимізувати взаємодію зі своїми клієнтами. Завдяки більш глибокому розумінню намірів користувачів і доступу до великої кількості структурованих і неструктурованих даних, організації зможуть надавати персоналізовані та цілеспрямовані відповіді, тим самим підвищуючи задоволеність і лояльність клієнтів. Актуальність теми дослідження засвідчується неабиякою трансформацією у сфері розробки інформаційних систем, викликаною створенням великих мовних моделей (Large Language Models, LLM). Технологічна динаміка, пов’язана із використанням великих мовних моделей, відкриває перед розробниками та дослідниками унікальні можливості для розширення функціональних можливостей чат-ботів та підвищення їхньої ефективності. Великі мовні моделі надають чат-ботам здатність розуміти та адаптуватися до природної мови користувачів на більш продуктивному рівні, враховуючи контекст та індивідуальні особливості спілкування. Однією з ключових переваг використання LLM в розробці чат-ботів є їхня здатність автоматично аналізувати та розпізнавати не тільки окремі слова чи фрази, але й розуміти глибший сенс висловлювань, враховуючи контекст та відтінки значень слів. Це відкриває двері для більшого розуміння інтенцій користувачів та забезпечує високий рівень персоналізації взаємодії. Така технологічна трансформація є ключовою у забезпеченні чат-ботів здатністю не лише виконувати стандартні завдання, але й надавати інтелектуальні та інтуїтивно зрозумілі відповіді на складні запитання. Це важливо не лише для користувачів, але й для компаній та організацій, які прагнуть вдосконалити свої сервіси та підвищити рівень задоволеності клієнтів. Основною метою роботи є демонстрація доцільності та ефективності інтеграції великих мовних моделей в архітектуру інформаційної системи чат-ботів. Використовуючи властиві великим мовним моделям можливості розуміння та генерації мови, ми прагнемо створити чат-бота, який не лише точніше розумітиме запити користувачів, але й відповідатиме на них у контекстно-відповідній та людській манері. Крім того, цей проект спрямований на створення надійної структури для зберігання та управління векторними даними, що дозволить чат-боту спиратися на багате джерело інформації для більш обґрунтованих відповідей. Об’єктом даного дослідження є інформаційні системи чат-ботів, що базуються на великих мовних моделях та векторних сховищах даних. Предметом дослідження є процес інтеграції великих мовних моделей в архітектуру інформаційної системи чат-ботів, а також створення ефективної структури для зберігання та управління векторними даними. Ключові слова: чат-боти, великі мовні моделі, векторні сховища даних, інтеграція, інформаційні системи.