Проєкт інформаційної системи визначення мови набору тексту
Автор: Пелешок Аліна Андріївна
Кваліфікаційний рівень: магістр
Спеціальність: Управління ІТ проектами
Інститут: Інститут комп'ютерних наук та інформаційних технологій
Форма навчання: денна
Навчальний рік: 2024-2025 н.р.
Мова захисту: українська
Анотація: У наш час інформаційні технології мають велике значення в різних аспектах людської діяльності, особливо в умовах постійного зростання обсягів текстової інформації та інтеграції комунікаційних процесів у глобальному масштабі. З огляду на це, однією з важливих задач є забезпечення точного й автоматизованого визначення мови введеного тексту. Це завдання набуває особливого значення для таких напрямків, як міжкультурна комунікація, переклад, семантичний аналіз текстів, а також у різних інформаційних системах, що працюють з багатомовним контентом. Автоматичне визначення мови є важливим для забезпечення точності й ефективності роботи в численних програмних продуктах, від текстових редакторів і платформ для автоматизованого перекладу до пошукових систем і сервісів аналітики даних [1,3]. Ця функціональність дозволяє системам коректно обробляти тексти різних мов, що, своєю чергою, сприяє підвищенню зручності використання й швидкості отримання результатів. Таким чином, автоматичне розпізнавання мови введеного тексту є не просто додатковою зручністю, а критично важливим інструментом для сучасних інформаційних систем. Автоматизація обробки багатомовного контенту є особливо актуальною для підвищення продуктивності й поліпшення якості роботи в багатьох галузях: від освіти, де вона може спростити роботу з різними мовами в навчальних ресурсах, до комерційних і бізнес-процесів, що працюють з клієнтами в міжнародному середовищі. Приклади відомих інструментів, як-от Grammarly, показують високий попит на такі рішення й підтверджують потребу в подальшому розвитку в цьому напрямку. Проте, незважаючи на наявність ефективних рішень, досі залишаються проблеми, пов’язані з точністю, швидкістю обробки й можливістю інтеграції подібних систем в інші платформи й застосунки. Окрему значущість цей напрямок дослідження має для українського ринку, де попит на якісні інформаційні технології постійно зростає, особливо в умовах активної глобалізації. Багатомовні системи, які застосовуються як у приватному, так і в професійному середовищі, є необхідним компонентом у повсякденному житті та діяльності. У цих умовах проєкт розробки системи автоматичного визначення мови введеного тексту є критично важливим і дозволить створити нові можливості для комунікацій та обробки даних в Україні та за її межами [2]. Об’єкт дослідження - процес автоматичного визначення мови тексту, Предмет дослідження - засоби та методи, що використовуються для автоматичного визначення мови тексту в інформаційній системі. Мета дослідження: створення інформаційної системи для автоматичного визначення мови набору тексту, яка забезпечуватиме високу точність розпізнавання мови в режимі реального часу. Для досягнення цієї мети поставлено наступні задачі: • провести аналіз існуючих методів визначення мови тексту та їх порівняння, здійснити огляд літературних та інших джерел • провести системний аналіз системи, визначити основну функцію та структуру системи, побудувати дерево цілей, а також порівняти різні варіанти способів вирішення проблеми; • описати та проаналізувати комплекс вимог до розроблюваної інформаційної системи; • створити план проєкту; • відобразити засоби та методи, які використовуються для вирішення поставленої задачі; • навести результати виконання проєкту. Результатами магістерської кваліфікаційної роботи є розроблений прототип проєкту інформаційної системи визначення мови набору тексту. Ключові слова: інформаційна система, аналіз тексту, мовна ідентифікація, багатомовний контент. Перелік використаних літературних джерел. 1. Рибчак З. Л., Кобилюх* Л. Б. Дослідження розпізнавання та перетворення української мови в текст засобами штучного інтелекту // Science and innovation of modern world : proceedings of the VII International scientific and practical conference, London, United Kingdom, 23–25 March 2023. – 2023. – C. 259–266. 2. Литвин В., Голощук Р., Досин Д., Высоцка В., Рибчак З. Застосування синтаксичного аналізу для визначення ключових слів у текстах українською мовою // Комп’ютерні науки та інформаційні технології: матеріали ХIІ Міжнародної науково-технічної конференції CSIT-2017 (Львів, Україна, 05–08 вересня 2017). – 2017. – С. 326–331. (Google Scholar, SciVerse SCOPUS, Web of Science). 3. Automatic Language Identification in Texts. Jauhiainen, T., Zampieri, M., Baldwin, T. C. & Linden, K., Jan 2024, Cham: Springer. 148 p. (Synthesis Lectures on Human Language Technologies).