Динамічне ранжування контенту з використанням класифікації тексту

Автор: Бешта Ярослав Тарасович
Кваліфікаційний рівень: магістр
Спеціальність: Комп'ютеризовані системи управління та автоматика
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Магістерська кваліфікаційна дипломна робота присвячена аналізу та дослідженню методів динамічного ранжування контенту з використанням адаптивної класифікації тексту. У дослідженні розглянуто широкий спектр питань, що включають класифікацію текстових даних, аналіз існуючих алгоритмів обробки та оцінку ефективності запропонованих методів у контексті оптимізації роботи інформаційних систем. Тема роботи охоплює важливі аспекти інтерактивної взаємодії користувачів із контентом, які спрямовані на забезпечення персоналізованих і релевантних результатів. Зібрані дані підкреслюють значення таких елементів, як адаптивна класифікація тексту, яка враховує зміни у вподобаннях користувачів, і алгоритми ранжування, які впроваджують контекстуальні та тематичні зв’язки. Ці методи мають вирішальне значення для функціонування сучасних інформаційних систем, включно з пошуковими платформами, новинними агрегаторами та соціальними мережами. Робота також акцентує увагу на важливості попередньої обробки текстових даних, яка включає токенізацію, лематизацію, виділення сутностей і визначення ключових слів. Цей етап є критично важливим для забезпечення точності і швидкості обчислень на наступних етапах класифікації та ранжування. Об’єктом дослідження є процеси динамічного ранжування контенту та обробки текстових даних у сучасних інформаційних системах. Предметом дослідження є алгоритми адаптивної класифікації тексту та методи ранжування, які забезпечують точність, релевантність і персоналізацію результатів для користувачів. Метою роботи є аналіз і розробка ефективного підходу до динамічного ранжування контенту з використанням адаптивних моделей для покращення роботи інформаційних систем у реальному часі. 8 У першому розділі, "Огляд і аналіз сучасних систем ранжування контенту", проведено детальний аналіз існуючих підходів до обробки даних у пошукових системах, новинних агрегаторах і соціальних мережах. Основну увагу приділено проблемам релевантності, контекстуальності й адаптивності систем, а також недолікам, пов’язаним із недостатньою персоналізацією, відсутністю багатомовної підтримки та маніпулятивним контентом. Аналіз показав, що традиційні методи ранжування не завжди враховують змінні потреби користувачів і виклики багатомовного середовища. Другий розділ, "Обґрунтування вибору методів і технологій", присвячено вибору ефективних інструментів і платформ для реалізації адаптивних алгоритмів класифікації тексту та динамічного ранжування контенту. Особливу увагу приділено вибору обчислювальних платформ, бібліотек для обробки тексту (таких як SpaCy і TensorFlow), а також методів інтеграції з великими базами даних і API. У розділі наведено обґрунтування вибору алгоритмів машинного навчання, які забезпечують адаптивність до змін користувацьких уподобань і поведінки. Третій розділ зосереджено на розробці та реалізації алгоритму динамічного ранжування контенту з урахуванням сучасних викликів. У ньому описано методологію побудови системи, зокрема її архітектуру, інтеграцію модулів обробки природної мови (NLP) і класифікації тексту, а також механізм адаптивного ранжування. Особливу увагу приділено зворотному зв’язку з користувачем, автоматичному інкрементальному навчання алгоритмів та інтеграції модерації для виявлення маніпулятивного або небажаного контенту. Результати досліджень показали ефективність запропонованих методів у контексті зменшення затримок обробки, підвищення точності класифікації та релевантності контенту. У межах експериментального тестування система продемонструвала на 15% вищу швидкість ранжування та на 12% точнішу класифікацію порівняно з аналогами. 9 Ключові слова: динамічне ранжування контенту, адаптивна класифікація тексту, обробка природної мови (NLP), алгоритми машинного навчання, персоналізація, інформаційні системи. ПЕРЕЛІК ВИКОРИСТАНИХ ЛІТЕРАТУРНИХ ДЖЕРЕЛ 1. Гуренко Ю. М. "Технології штучного інтелекту для інформаційних систем". Київ: Науково-технічне видавництво, 2021. 2. Олійник С. Г., Мельник В. В. "Моделювання систем обробки даних". Харків: Видавництво "Ранок", 2022. 3. Кравчук П.О., "Методи та засоби обробки даних в системах Інтернету речей", Львів: Видавництво Національного університету "Львівська політехніка", 2019 4. Литвин В. В., Висоцька В. А., Досин Д. Г. "Методи та засоби опрацювання інформаційних ресурсів на основі онтологій". Львів: Видавництво Львівської політехніки 5. Висоцька В. А. "Аналіз та синтез комп’ютерних лінгвістичних систем опрацювання україномовного текстового контенту": автореф. дис. ... д-ра техн. наук. Львів: Національний університет "Львівська політехніка", 2021. 6. Чирун В., Висоцька В. А. "Метод контент-аналізу текстової інформації інтернет-газети" // Науковий вісник НУ "Львівська політехніка". Серія: Інформаційні системи та мережі. – 2017. – № 864 10