Прикладний аналіз тексту

Спеціальність: Філологія (прикладна лінгвістика)
Код дисципліни: 6.035.10.E.074
Кількість кредитів: 4.00
Кафедра: Прикладна лінгвістика
Лектор: к.філол.н., доц. Ділай Маріанна Петрівна
Семестр: 8 семестр
Форма навчання: денна
Мета вивчення дисципліни: Ознайомити студентів із основними поняттями, методами та інструментами текст-майнингу та аналітики тексту
Завдання: ІНТ. Здатність розв’язувати складні спеціалізовані задачі та практичні проблеми в галузі філології (лінгвістики, літературознавства, фольклористики, перекладу) в процесі професійної діяльності або навчання, що передбачає застосування теорій та методів філологічної науки і характеризується комплексністю та невизначеністю умов. ЗК3. Здатність спілкуватися державною мовою як усно, так і письмово. ЗК5. Здатність учитися й оволодівати сучасними знаннями. ЗК6. Здатність до пошуку, опрацювання та аналізу інформації з різних джерел. ЗК7. Уміння виявляти, ставити та вирішувати проблеми. ЗК8. Здатність працювати в команді та автономно. ЗК9. Здатність спілкуватися іноземною мовою. ЗК10. Здатність до абстрактного мислення, аналізу та синтезу. ЗК11. Здатність застосовувати знання у практичних ситуаціях. ЗК12. Навички використання інформаційних і комунікаційних технологій. ФК2. Здатність використовувати в професійній діяльності знання про мову як особливу знакову систему, її природу, функції, рівні. ФК3. Здатність використовувати в професійній діяльності знання з теорії та історії мов(и), що вивчаються(ється). ФЛ6. Здатність вільно, гнучко й ефективно використовувати мову(и), що вивчається(ються), в усній та письмовій формі, у різних жанрово-стильових різновидах і регістрах спілкування (офіційному, неофіційному, нейтральному), для розв’язання комунікативних завдань у різних сферах життя. ФК7. Здатність до збирання й аналізу, систематизації та інтерпретації мовних, літературних, фольклорних фактів, інтерпретації та перекладу тексту (залежно від обраної спеціалізації). ФК8. Здатність вільно оперувати спеціальною термінологією для розв’язання професійних завдань. ФК9. Усвідомлення засад і технологій створення текстів різних жанрів і стилів державною та іноземною (іноземними) мовами. ФК10. Здатність здійснювати лінгвістичний, літературознавчий та спеціальний філологічний аналіз текстів різних стилів і жанрів. ФК13. Здатність використовувати теоретичні та фундаментальні знання в галузі прикладної лінгвістики для вивчення комп’ютерних систем і технологій, що опрацьовують лінгвальні дані. ФК15. Здатність використовувати відповідне програмне забезпечення (мови програмування, пакети) для проведення лінгвістичних та методологічних досліджень.
Результати навчання: ПРН1. Вільно спілкуватися з професійних питань із фахівцями та нефахівцями державною та іноземними мовами усно й письмово, використовувати їх для організації ефективної міжкультурної комунікації. ПРН2. Ефективно працювати з інформацією: добирати необхідну інформацію з різних джерел, зокрема з фахової літератури та електронних баз, критично аналізувати й інтерпретувати її, впорядковувати, класифікувати й систематизувати. ПРН3. Організовувати процес свого навчання й самоосвіти. ПРН6. Використовувати інформаційні й комунікаційні технології для вирішення складних спеціалізованих задач і проблем професійної діяльності. ПРН7. Розуміти основні проблеми філології та підходи до їх розв’язання із застосуванням доцільних методів та інноваційних підходів. ПРН9. Характеризувати діалектні та соціальні різновиди мов, що вивчаються, описувати соціолінгвальну ситуацію ПРН12. Аналізувати мовні одиниці, визначати їхню взаємодію та характеризувати мовні явища і процеси, що їх зумовлюють. ПРН14. Використовувати мови, що вивчаються, в усній та письмовій формі, у різних жанрово-стильових різновидах і регістрах спілкування (офіційному, неофіційному, нейтральному), для розв’язання комунікативних завдань у побутовій, суспільній, навчальній, професійній, науковій сферах життя. ПРН15. Здійснювати лінгвістичний, літературознавчий та спеціальний філологічний аналіз текстів різних стилів і жанрів. ПРН16. Знати й розуміти основні поняття, теорії та концепції обраної філологічної спеціалізації, уміти застосовувати їх у професійній діяльності. ПРН17. Збирати, аналізувати, систематизувати й інтерпретувати факти мови й мовлення й використовувати їх для розв’язання складних задач і проблем у спеціалізованих сферах професійної діяльності та/або навчання. ПРН 19. Мати навички участі в наукових або прикладних дослідженнях у галузі філології.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Основи прикладної лінгвістики Основи комп’ютерних лінгвотехнологій Основи автоматизованого опрацювання природної мови Корпусна лінгвістика
Короткий зміст навчальної програми: Навчальна дисципліна спрямована на висвітлення основних аспектів, методів та інструментів прикладного (автоматизованого) аналізу тесту, який передбачає комп’ютерне опрацювання та використання текстової інформації в різних практичних задачах. Вивчаємо особливості добування інформації, кластеризації та класифікації текстів. Передбачено використання сучасного програмного забезпечення для здійснення автоматизованого семантичного та тематичного аналізу. Зосереджуємо увагу на методах автоматизованого виявлення тональності текстів, розпізнаванні настроїв та ставлення (інструменти Orange, Hugging Face platform, LIWC, SentiStrength, UAM corpus tool (Appraisal framework)). Розкриваємо потенціал корпусного аналізу текстів, передусім дослідження ключовості (keyness) та колокаційних (асоціативних) мереж (LancsBox, Sketch Engine)). Розглядаємо роль статистичних параметрів у встановленні стилю та авторства тексту (TextAttributor). Аналізуємо психологічні параметри тексту (LIWC). Розглядаємо методику здійснення контент аналізу, передусім для дослідження сприйняття і засвоєння медійної інформації та медіа-моніторингу. Проводимо інтент аналіз політичних медіа текстів для виявлення ознак пропаганди та маніпулювання. Звертаємося до поняття лінгвістичної експертизи тексту у широкому і вузькому значенні.
Опис: Text mining and text analytics. Text mining areas. Tasks and applications. Text analytics process. Natural-Language Processing (NLP). Levels of linguistic processing. Lemmatization and Stemming. POS tagging (CLAWS). Parsing. Semantic tagging (UCREL Semantic Analysis System (USAS)). Wmatrix. Document clustering (Orange). Bag of words. Document embedding. Document categorization (Orange). Categorization models and evaluation. Sentiment analysis (Orange. LIWC. SentiStrength. Visualizing Social Media Sentiment. UAM corpus tool (Appraisal framework)). Corpus-assisted discourse studies. Concordance. Keyness analysis (Sketch Engine, English Corpora). Collocation (association) networks. LancsBox (GraphCol). Digital humanities. Distant reading (Voyant tools). Literary text analysis (CLiC). Stylometry. Statistical parameters of text (TextAttributor). Psychological text analysis in the digital humanities (LIWC). Intent analysis. Analysis of political texts. Analysis of media texts. Linguistic expertise of text; forensic linguistics.
Методи та критерії оцінювання: • Поточний контроль: усне опитування, виконання практичних завдань, виконання індивідуального завдання, тестування у ВНС. • Підсумковий контроль: іспит (письмовий тест, усне опитування.
Критерії оцінювання результатів навчання: Поточний контроль – 40 балів - 10 балів – оцінка за усне опитування на практичних заняттях, виконання практичних завдань; - 20 балів – індивідуальне завдання (автоматизований аналіз тексту і презентація результатів); - 10 балів – тестування у ВНС. Іспит - 60 балів - письмова компонента - 40 балів; - усна компонента - 20 балів.
Порядок та критерії виставляння балів та оцінок: 100-88 балів - атестований з оцінкою «відмінно» - Високий рівень: здобувач освіти демонструє поглиблене володіння поняттєвим та категорійним апаратом навчальної дисципліни, системні знання, вміння і навички їх практичного застосування. Освоєні знання, вміння і навички забезпечують можливість самостійного формулювання цілей та організації навчальної діяльності, пошуку та знаходження рішень у нестандартних, нетипових навчальних і професійних ситуаціях. Здобувач освіти демонструє здатність робити узагальнення на основі критичного аналізу фактичного матеріалу, ідей, теорій і концепцій, формулювати на їх основі висновки. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку, самостійної науково-дослідної діяльності, що реалізується за підтримки та під керівництвом викладача. 87-71 балів - атестований з оцінкою «добре» - Достатній рівень: передбачає володіння поняттєвим та категорійним апаратом навчальної дисципліни на підвищеному рівні, усвідомлене використання знань, умінь і навичок з метою розкриття суті питання. Володіння частково-структурованим комплексом знань забезпечує можливість їх застосування у знайомих ситуаціях освітнього та професійного характеру. Усвідомлюючи специфіку задач та навчальних ситуацій, здобувач освіти демонструє здатність здійснювати пошук та вибір їх розв’язання за поданим зразком, аргументувати застосування певного способу розв’язання задачі. Його діяльності ґрунтується на зацікавленості та мотивації до саморозвитку, неперервного професійного розвитку. 70-50 балів - атестований з оцінкою «задовільно» - Задовільний рівень: окреслює володіння поняттєвим та категорійним апаратом навчальної дисципліни на середньому рівні, часткове усвідомлення навчальних і професійних задач, завдань і ситуацій, знання про способи розв’язання типових задач і завдань. Здобувач освіти демонструє середній рівень умінь і навичок застосування знань на практиці, а розв’язання задач потребує допомоги, опори на зразок. В основу навчальної діяльності покладено ситуативність та евристичність, домінування мотивів обов’язку, неусвідомлене застосування можливостей для саморозвитку. 49-00 балів - атестований з оцінкою «незадовільно» - Незадовільний рівень: свідчить про елементарне володіння поняттєвим та категорійним апаратом навчальної дисципліни, загальне уявлення про зміст навчального матеріалу, часткове використання знань, умінь і навичок. В основу навчальної діяльності покладено ситуативно-прагматичний інтерес.
Рекомендована література: 1. Atkinson-Abutridy J. Text Analytics. An Introduction to the Science and Applications of Unstructured Information Analysis. Chapman & Hall. 2022. 2. Baker, P. Using Corpora in Discourse Analysis. London: Continuum, 2006. 3. Brezina, V., McEnery, T., Wattam, S. (2015) Collocations in context. A new perspective on collocation networks. International Journal of Corpus Linguistics 20:2 (2015), 139–173. doi 10.1075/ijcl.20.2.01bre issn 1384–6655 / e-issn 1569–9811 4. Cushing I. Cambridge Topics in English Language Text Analysis and Representation. Cambridge University Press. 2018. 5. Dilai, I., & Dilai, M. (2022). The role of frequency in linguistic research. Transcarpathian Philological Studies, Uzhgorod National University, 21(1), 146-151. DOI: https://doi.org/10.32782/tps2663-4880/2022.21.1.27 [in Ukrainian]. 6. Liu, B. (2020). Sentiment Analysis. In Sentiment Analysis: Mining Opinions, Sentiments, and Emotions (Studies in Natural Language Processing, p. I). Cambridge: Cambridge University Press. 7. Dilai M.P. Sentiment Analysis of Contemporary Anglican Sermons. In: Challenges and achievements of European countries in the area of philological researches : Collective monograph. Riga, Latvia : “Baltija Publishing”, 2020. 149-170. DOI https://doi.org/10.30525/978-9934-26-027-8-9 8. Dilai, M., & Dilai, I. (2023). Triangulation in Modern Linguistic Research: Cognition – Corpus – Discourse. Scientific Notes of V. I. Vernadsky Taurida National University, Philology. Journalism, 34(73), 2(1), 58-62. https://doi.org/10.32782/2710-4656/2023.2.1/11[in Ukrainian]. 9. Best Text Analysis Software. https://www.g2.com/categories/text-analysis 10. Гарбера І.В. Основи лінгвістичної експертизи тексту: Навчально-методичний посібник. Вінниця, 2020. 220 с.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою: вул. Карпінського, 2/4, І-й н.к., кімн. 112 E-mail: nolimits@lpnu.ua Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).