Інтелектуальна система кластеризації даних на основі мережі з дипольною взаємодією між нейронами
Автор: Дудик Дмитро Олександрович
Кваліфікаційний рівень: магістр (ОНП)
Спеціальність: Системний аналіз (освітньо-наукова програма)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: У магістерській кваліфікаційній роботі спроектовано та реалізовано інтелектуальну систему кластеризації даних на основі осциляторної хаотичної мережі з дипольними взаємодіями між нейронами. Система орієнтована на кластеризацію даних зі складною структурою з метою виявлення внутрішніх закономірностей і групування схожих об’єктів у кластери. У роботі розглядаються основні аспекти кластеризації, проблеми, що виникають, і методи автоматизації цього процесу без потреби в ручному втручанні або попередніх відомостях про структуру даних. Об’єктом дослідження є процеси кластеризації даних, а предметом дослідження є методи та алгоритми кластеризації з використанням осциляторної хаотичної нейронної мережі (ОХНМ) з дипольною взаємодією між нейронами. В основі роботи осциляторної хаотичної нейронної мережі лежить процес колективної синхронізації зв’язаних осциляторів. Система поєднує нелінійні характеристики штучних нейронних мереж і ергодичні властивості хаосу, що забезпечує високу точність і ефективність кластеризації, дозволяючи виявляти приховані закономірності в даних. Актуальність системи обумовлена експоненціальним збільшенням обсягів даних, що створює потребу в ефективних методах їх аналізу та обробки. Традиційні методи кластеризації часто не справляються з великими обсягами даних, особливо якщо дані мають складну структуру. Використання ОХНМ з дипольною взаємодією дозволяє підвищити точність і ефективність кластеризації, що робить це дослідження надзвичайно актуальним. Робота складається зі вступу, п’яти розділів, висновків, списку посилань та додатків. Перший розділ присвячений огляду існуючих методів кластеризації даних, їх класифікації та порівнянню. У ньому розглянуто основні проблеми кластеризації даних та шляхи їх вирішення. Другий розділ детально розглядає структуру і принципи функціонування системи кластеризації на основі ОХНМ за допомогою UML діаграм. Також описано постановку та обґрунтування розробки системи. Третій розділ присвячений вибору методів та інструментів розробки системи кластеризації на основі ОХНМ з дипольною взаємодією. Описуються етапи створення моделі, вибір алгоритмів та інструментів для її реалізації. Четверний розділ описує реалізовану систему кластеризації та порівнює її ефективність з моделлю ОХНМ з Ґаусовими взаємодіями між нейронами. Розглядаються результати експериментів на наборі даних Atom та аналізується якість кластеризації, досягнута за допомогою ОХНМ. П’ятий розділ економічно обґрунтовує доцільність розробки системи, показуючи, що її впровадження може значно знизити витрати на аналіз даних та підвищити ефективність бізнес-процесів. Визначено комплексний показник якості та розрахунок витрат на розробку і впровадження проектного рішення показали, що система є економічно вигідною та окупиться приблизно за два роки. Наукова новизна роботи полягає в розвитку методу кластеризації осциляторними хаотичними нейронними мережами шляхом використання дипольних синаптичних зв’язків. Це вдосконалення дозволяє ефективніше виявляти складні взаємодії між об’єктами даних. В результаті дослідження було: 1. Побудовано ОХНМ з дипольними синаптичними зв’язками, яка виявилася ефективною у кластеризації даних завдяки функції з повільним спаданням дипольних зв’язків. 2. Встановлено, що модель з дипольними синаптичними зв’язками забезпечує більшу синхронізацію нейронів, що відповідають за формування кластерів, порівняно з моделлю з Ґаусовими зв’язками. 3. Показано, що модель з дипольними синаптичними зв’язками забезпечує більший інтервал роздільної здатності, що робить її ефективнішою для різноманітних наборів даних незалежно від їх складності. 4. Встановлено, що мережа з дипольними зв’язками є менш чутливою до кількості найближчих сусідів порівняно з мережею з Ґаусовими синаптичними зв’язками, що робить її більш гнучкою для вирішення завдань кластеризації. 5. Визначено, що оптимальне число сусідів для кожної моделі та конкретного набору даних є ключовим фактором для досягнення максимальної роздільної здатності та ефективності кластеризації. Розроблена система має широкі можливості для застосування в різних сферах, включаючи фінансовий сектор, охорону здоров’я, виробництво, та інші галузі, де обробка великих даних є критично важливою. Висока точність роботи системи дозволяють значно покращити якість прийняття рішень, що базуються на аналізі даних, і підвищити конкурентоспроможність організацій. Ключові слова – кластеризація, колективна синхронізація зв’язаних осциляторів, осциляторна хаотична нейронна мережа, дипольні синаптичні зв’язки.