Прикладний аналіз тексту

Спеціальність: Філологія (прикладна лінгвістика)
Код дисципліни: 6.035.10.E.074
Кількість кредитів: 4.00
Кафедра: Прикладна лінгвістика
Лектор: к.філол.н., доц. Ділай Маріанна Петрівна
Семестр: 8 семестр
Форма навчання: денна
Мета вивчення дисципліни: Ознайомити студентів із основними поняттями, методами та інструментами текст-майнингу та аналітики тексту
Завдання: ІНТ. Здатність розв’язувати складні спеціалізовані задачі та практичні проблеми в галузі філології (лінгвістики, літературознавства, фольклористики, перекладу) в процесі професійної діяльності або навчання, що передбачає застосування теорій та методів філологічної науки і характеризується комплексністю та невизначеністю умов. ЗК3. Здатність спілкуватися державною мовою як усно, так і письмово. ЗК5. Здатність учитися й оволодівати сучасними знаннями. ЗК6. Здатність до пошуку, опрацювання та аналізу інформації з різних джерел. ЗК7. Уміння виявляти, ставити та вирішувати проблеми. ЗК8. Здатність працювати в команді та автономно. ЗК9. Здатність спілкуватися іноземною мовою. ЗК10. Здатність до абстрактного мислення, аналізу та синтезу. ЗК11. Здатність застосовувати знання у практичних ситуаціях. ЗК12. Навички використання інформаційних і комунікаційних технологій. ФК2. Здатність використовувати в професійній діяльності знання про мову як особливу знакову систему, її природу, функції, рівні. ФК3. Здатність використовувати в професійній діяльності знання з теорії та історії мов(и), що вивчаються(ється). ФЛ6. Здатність вільно, гнучко й ефективно використовувати мову(и), що вивчається(ються), в усній та письмовій формі, у різних жанрово-стильових різновидах і регістрах спілкування (офіційному, неофіційному, нейтральному), для розв’язання комунікативних завдань у різних сферах життя. ФК7. Здатність до збирання й аналізу, систематизації та інтерпретації мовних, літературних, фольклорних фактів, інтерпретації та перекладу тексту (залежно від обраної спеціалізації). ФК8. Здатність вільно оперувати спеціальною термінологією для розв’язання професійних завдань. ФК9. Усвідомлення засад і технологій створення текстів різних жанрів і стилів державною та іноземною (іноземними) мовами. ФК10. Здатність здійснювати лінгвістичний, літературознавчий та спеціальний філологічний аналіз текстів різних стилів і жанрів. ФК13. Здатність використовувати теоретичні та фундаментальні знання в галузі прикладної лінгвістики для вивчення комп’ютерних систем і технологій, що опрацьовують лінгвальні дані. ФК15. Здатність використовувати відповідне програмне забезпечення (мови програмування, пакети) для проведення лінгвістичних та методологічних досліджень.
Результати навчання: ПРН1. Вільно спілкуватися з професійних питань із фахівцями та нефахівцями державною та іноземними мовами усно й письмово, використовувати їх для організації ефективної міжкультурної комунікації. ПРН2. Ефективно працювати з інформацією: добирати необхідну інформацію з різних джерел, зокрема з фахової літератури та електронних баз, критично аналізувати й інтерпретувати її, впорядковувати, класифікувати й систематизувати. ПРН3. Організовувати процес свого навчання й самоосвіти. ПРН6. Використовувати інформаційні й комунікаційні технології для вирішення складних спеціалізованих задач і проблем професійної діяльності. ПРН7. Розуміти основні проблеми філології та підходи до їх розв’язання із застосуванням доцільних методів та інноваційних підходів. ПРН9. Характеризувати діалектні та соціальні різновиди мов, що вивчаються, описувати соціолінгвальну ситуацію ПРН12. Аналізувати мовні одиниці, визначати їхню взаємодію та характеризувати мовні явища і процеси, що їх зумовлюють. ПРН14. Використовувати мови, що вивчаються, в усній та письмовій формі, у різних жанрово-стильових різновидах і регістрах спілкування (офіційному, неофіційному, нейтральному), для розв’язання комунікативних завдань у побутовій, суспільній, навчальній, професійній, науковій сферах життя. ПРН15. Здійснювати лінгвістичний, літературознавчий та спеціальний філологічний аналіз текстів різних стилів і жанрів. ПРН16. Знати й розуміти основні поняття, теорії та концепції обраної філологічної спеціалізації, уміти застосовувати їх у професійній діяльності. ПРН17. Збирати, аналізувати, систематизувати й інтерпретувати факти мови й мовлення й використовувати їх для розв’язання складних задач і проблем у спеціалізованих сферах професійної діяльності та/або навчання. ПРН 19. Мати навички участі в наукових або прикладних дослідженнях у галузі філології.
Необхідні обов'язкові попередні та супутні навчальні дисципліни: Основи прикладної лінгвістики Основи комп’ютерних лінгвотехнологій Основи автоматизованого опрацювання природної мови Корпусна лінгвістика
Короткий зміст навчальної програми: Навчальна дисципліна спрямована на висвітлення основних аспектів, методів та інструментів прикладного (автоматизованого) аналізу тесту, який передбачає комп’ютерне опрацювання та використання текстової інформації в різних практичних задачах. Вивчаємо особливості добування інформації, кластеризації та класифікації текстів. Передбачено використання сучасного програмного забезпечення для здійснення автоматизованого семантичного та тематичного аналізу. Зосереджуємо увагу на методах автоматизованого виявлення тональності текстів, розпізнаванні настроїв та ставлення (інструменти Orange, Hugging Face platform, LIWC, SentiStrength, UAM corpus tool (Appraisal framework)). Розкриваємо потенціал корпусного аналізу текстів, передусім дослідження ключовості (keyness) та колокаційних (асоціативних) мереж (LancsBox, Sketch Engine)). Розглядаємо роль статистичних параметрів у встановленні стилю та авторства тексту (TextAttributor). Аналізуємо психологічні параметри тексту (LIWC). Розглядаємо методику здійснення контент аналізу, передусім для дослідження сприйняття і засвоєння медійної інформації та медіа-моніторингу. Проводимо інтент аналіз політичних медіа текстів для виявлення ознак пропаганди та маніпулювання. Звертаємося до поняття лінгвістичної експертизи тексту у широкому і вузькому значенні.
Опис: Text mining and text analytics. Text mining areas. Tasks and applications. Text analytics process. Natural-Language Processing (NLP). Levels of linguistic processing. Lemmatization and Stemming. POS tagging (CLAWS). Parsing. Semantic tagging (UCREL Semantic Analysis System (USAS)). Wmatrix. Document clustering (Orange). Bag of words. Document embedding. Document categorization (Orange). Categorization models and evaluation. Sentiment analysis (Orange. LIWC. SentiStrength. Visualizing Social Media Sentiment. UAM corpus tool (Appraisal framework)). Corpus-assisted discourse studies. Concordance. Keyness analysis (Sketch Engine, English Corpora). Collocation (association) networks. LancsBox (GraphCol). Digital humanities. Distant reading (Voyant tools). Literary text analysis (CLiC). Stylometry. Statistical parameters of text (TextAttributor). Psychological text analysis in the digital humanities (LIWC). Intent analysis. Analysis of political texts. Analysis of media texts. Linguistic expertise of text; forensic linguistics.
Методи та критерії оцінювання: • Поточний контроль: усне опитування, виконання практичних завдань, виконання індивідуального завдання, тестування у ВНС. • Підсумковий контроль: іспит (письмовий тест, усне опитування.
Критерії оцінювання результатів навчання: Поточний контроль – 40 балів - 10 балів – оцінка за усне опитування на практичних заняттях, виконання практичних завдань; - 20 балів – індивідуальне завдання (автоматизований аналіз тексту і презентація результатів); - 10 балів – тестування у ВНС. Іспит - 60 балів - письмова компонента - 40 балів; - усна компонента - 20 балів.
Порядок та критерії виставляння балів та оцінок: 100–88 балів – («відмінно») виставляється за високий рівень знань (допускаються деякі неточності) навчального матеріалу компонента, що міститься в основних і додаткових рекомендованих літературних джерелах, вміння аналізувати явища, які вивчаються, у їхньому взаємозв’язку і роз витку, чітко, лаконічно, логічно, послідовно відповідати на поставлені запитання, вміння застосовувати теоретичні положення під час розв’язання практичних задач; 87–71 бал – («добре») виставляється за загалом правильне розуміння навчального матеріалу компонента, включаючи розрахунки , аргументовані відповіді на поставлені запитання, які, однак, містять певні (неістотні) недоліки, за вміння застосовувати теоретичні положення під час розв’язання практичних задач; 70 – 50 балів – («задовільно») виставляється за слабкі знання навчального матеріалу компонента, неточні або мало аргументовані відповіді, з порушенням послідовності викладення, за слабке застосування теоретичних положень під час розв’язання практичних задач; 49–26 балів – («не атестований» з можливістю повторного складання семестрового контролю) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння застосувати теоретичні положення під час розв’язання практичних задач; 25–00 балів – («незадовільно» з обов’язковим повторним вивченням) виставляється за незнання значної частини навчального матеріалу компонента, істотні помилки у відповідях на запитання, невміння орієнтуватися під час розв’язання практичних задач, незнання основних фундаментальних положень.
Рекомендована література: 1. Atkinson-Abutridy J. Text Analytics. An Introduction to the Science and Applications of Unstructured Information Analysis. Chapman & Hall. 2022. 2. Baker, P. Using Corpora in Discourse Analysis. London: Continuum, 2006. 3. Brezina, V., McEnery, T., Wattam, S. (2015) Collocations in context. A new perspective on collocation networks. International Journal of Corpus Linguistics 20:2 (2015), 139–173. doi 10.1075/ijcl.20.2.01bre issn 1384–6655 / e-issn 1569–9811 4. Cushing I. Cambridge Topics in English Language Text Analysis and Representation. Cambridge University Press. 2018. 5. Dilai, I., & Dilai, M. (2022). The role of frequency in linguistic research. Transcarpathian Philological Studies, Uzhgorod National University, 21(1), 146-151. DOI: https://doi.org/10.32782/tps2663-4880/2022.21.1.27 [in Ukrainian]. 6. Liu, B. (2020). Sentiment Analysis. In Sentiment Analysis: Mining Opinions, Sentiments, and Emotions (Studies in Natural Language Processing, p. I). Cambridge: Cambridge University Press. 7. Dilai M.P. Sentiment Analysis of Contemporary Anglican Sermons. In: Challenges and achievements of European countries in the area of philological researches : Collective monograph. Riga, Latvia : “Baltija Publishing”, 2020. 149-170. DOI https://doi.org/10.30525/978-9934-26-027-8-9 8. Dilai, M., & Dilai, I. (2023). Triangulation in Modern Linguistic Research: Cognition – Corpus – Discourse. Scientific Notes of V. I. Vernadsky Taurida National University, Philology. Journalism, 34(73), 2(1), 58-62. https://doi.org/10.32782/2710-4656/2023.2.1/11[in Ukrainian]. 9. Best Text Analysis Software. https://www.g2.com/categories/text-analysis 10. Гарбера І.В. Основи лінгвістичної експертизи тексту: Навчально-методичний посібник. Вінниця, 2020. 220 с.
Уніфікований додаток: Національний університет «Львівська політехніка» забезпечує реалізацію права осіб з інвалідністю на здобуття вищої освіти. Інклюзивні освітні послуги надає Служба доступності до можливостей навчання «Без обмежень», метою діяльності якої є забезпечення постійного індивідуального супроводу навчального процесу студентів з інвалідністю та хронічними захворюваннями. Важливим інструментом імплементації інклюзивної освітньої політики в Університеті є Програма підвищення кваліфікації науково-педагогічних працівників та навчально-допоміжного персоналу у сфері соціальної інклюзії та інклюзивної освіти. Звертатися за адресою: вул. Карпінського, 2/4, І-й н.к., кімн. 112 E-mail: nolimits@lpnu.ua Websites: https://lpnu.ua/nolimits https://lpnu.ua/integration
Академічна доброчесність: Політика щодо академічної доброчесності учасників освітнього процесу формується на основі дотримання принципів академічної доброчесності з урахуванням норм «Положення про академічну доброчесність у Національному університеті «Львівська політехніка» (затверджене вченою радою університету від 20.06.2017 р., протокол № 35).