Система аналізу медичних текстів і медичних висновків
Автор: Безкоровайний Олександр Віталійович
Кваліфікаційний рівень: магістр
Спеціальність: Аналіз даних (Data Science)
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: Ця магістерська робота спрямована на розробку інформаційної системи, яка автоматизує аналіз медичних текстів, результатів обстежень та лікарських висновків за допомогою сучасних технологій штучного інтелекту (ШІ) та обробки природної мови (NLP). У медичній сфері обсяг текстових даних постійно зростає, що значно ускладнює їх ручну обробку, робить її неефективною та трудомісткою. Виникає потреба в автоматизації аналізу цих даних для забезпечення швидкої та точної обробки, що допомагає значно підвищити якість медичних послуг. Головною метою дослідження є розробка системи, яка сприяє прискоренню діагностики, підвищує точність у прийнятті клінічних рішень та мінімізує ймовірність людських помилок у клінічній практиці. Об’єкт дослідження: процес автоматизації аналізу медичних текстів і даних. Предмет дослідження: методи обробки природної мови та алгоритми машинного навчання, які дозволяють забезпечити швидкий і точний аналіз текстової інформації в медичних записах. Основний зміст роботи: Розроблена інформаційна система складається з декількох функціональних модулів, кожен з яких відповідає за виконання конкретних завдань у процесі автоматизованого аналізу медичних текстів. Модуль розпізнавання симптомів аналізує текстовий опис стану пацієнта, виділяючи ключові симптоми, що полегшує лікарям попереднє визначення діагнозів. Модуль діагностики використовує витягнуту інформацію для співставлення з відомими захворюваннями, що забезпечує точніше та оперативніше встановлення попереднього діагнозу. Також передбачено модуль рекомендацій щодо подальших обстежень або лікування, який дозволяє лікарям ухвалювати обґрунтовані рішення щодо наступних кроків у лікуванні пацієнтів. Система використовує методи обробки природної мови, що дозволяють автоматично виділяти медичні терміни, структури та ключові фрази з текстів. Бібліотека Natural Language Toolkit (NLTK) застосовується для таких завдань, як токенізація, лематизація та попередня обробка текстів, тоді як бібліотека Scikit-learn відповідає за класифікацію та кластеризацію текстових даних. Інтеграція з електронними медичними записами (EMR) дозволяє системі оперативно оновлювати інформацію про стан пацієнта, надаючи лікарям доступ до актуальних даних для прийняття рішень. Це особливо важливо в умовах великих лікарень і клінік, де медичний персонал має справу з великим обсягом записів і обстежень щодня. Автоматизація процесів аналізу даних не тільки підвищує ефективність, але й мінімізує ризик помилок через людський фактор. Окрім цього, розроблена система має зручний інтерфейс для медичного персоналу, що дозволяє легко взаємодіяти з нею без необхідності спеціальних технічних знань. Система забезпечує візуалізацію даних, створюючи графічні звіти про стан пацієнта, його прогрес або зміни у здоров’ї. Завдяки цьому лікарі можуть швидко оцінити стан пацієнта та приймати більш обґрунтовані рішення. Система також здатна інтегруватися з іншими медичними інформаційними системами, що сприяє комплексному підходу до надання медичних послуг. Система має кілька значних переваг порівняно з існуючими рішеннями на ринку. Серед основних переваг — низька вартість впровадження, висока продуктивність, а також можливість масштабування та персоналізації під специфічні потреби медичних установ. Вона відповідає сучасним стандартам захисту медичних даних і забезпечує високий рівень конфіденційності інформації про пацієнтів, що є важливим у медичній сфері. Результати дослідження: Результати тестування показали, що розроблена система значно підвищує швидкість обробки медичних текстів і точність попередньої діагностики. Це може суттєво зменшити навантаження на лікарів, особливо у випадках обробки великих обсягів інформації, наприклад, під час пандемії чи надзвичайних ситуацій. Система також демонструє потенціал для подальшого вдосконалення та адаптації до потреб різних медичних закладів, що робить її перспективним інструментом для впровадження в сучасних лікарнях та клініках. Ключові слова: автоматизація, обробка природної мови, штучний інтелект, медичні тексти, діагностика, лікування. Список використаних джерел: 1. Барановський, А. І., Козаченко, М. Г. Моделі та методи аналізу медичних текстів із застосуванням нейронних мереж. Вісник Національного технічного університету «Харківський політехнічний інститут», (30), 45-51. 2020. 2. Василенко, О. В., Дмитрук, Л. В., Іванова, К. С. Використання NLP для автоматизації діагностики на основі медичних текстів. Медична інформатика та інженерія, 14(3), 19-24. 2019. 3. Глущенко, І. М., Синиця, О. О. Програмне забезпечення для обробки медичних даних: виклики і перспективи. Комп’ютерні науки та інформаційні технології, 28(1), 82-89. 2022. 4. Горбань, А. І., Марченко, С. О. Методи класифікації текстових медичних даних з використанням алгоритмів машинного навчання. Вісник Харківського національного університету радіоелектроніки, 28(2), 91-97. 2021. 5. Іванченко, О. В., Ткаченко, Ю. А. Автоматизація діагностики на основі текстових описів у медичних документах. Медична інформатика та інженерія, 15(4), 29-35. 2019.