Дослідження нейромережевих алгоритмів клонування голосу та розробка критеріїв оцінювання їх якості

Автор: Поворозник Володимир Богданович
Кваліфікаційний рівень: магістр
Спеціальність: Інформаційно-вимірювальні технології у робототехніці
Інститут: Інститут комп'ютерних технологій, автоматики та метрології
Форма навчання: денна
Навчальний рік: 2023-2024 н.р.
Мова захисту: українська
Анотація: У цій кваліфікаційній роботі досліджуються різні моделі та методології клонування голосу, їх потенційні застосування та ризики неправомірного використання. Розглядається стандартна техніка оцінювання для цих технологій, середня оцінка думки (MOS), поряд з автоматизованими методами оцінювання, визначаючи найбільш прийнятні підходи. Результати експериметів показують що такі метрики, як косинусна дистанція, застосована до ембедінгів спікера, демонструють високу кореляцію з суб’єктивними людськими оцінками. Це означає, що такі показники можуть служити ефективними та об’єктивними інструментами для оцінки якості моделей клонування голосу, зменшуючи варіативність, спричинену людським фактором. Серед оцінюваних засобів модель Titanet досягає найвищої кореляції з людськими судженнями, що свідчить про її перевагу у вловленні нюансів ідентифікації голосу