Освіта у Львівській політехніці

Пристрій для розпізнавання звуків на базі ПЛІС

Автор: Шевцов Всеволод Олександрович

Кваліфікаційний рівень: магістр

Спеціальність: Радіоелектронні пристрої, системи та комплекси

Інститут: Інститут телекомунікацій, радіоелектроніки та електронної техніки

Форма навчання: денна

Навчальний рік: 2020-2021 н.р.

Мова захисту: англійська

Анотація: Шевцов В.О., Манковський С.В. (керівник). Пристрій для розпізнавання звуку на базі ПЛІС. Магістерська кваліфікаційна робота. - Національний університет “Львівська політехніка”, Львів, 2020. Розширена анотація Пристрій для розпізнавання звуків - це певний пристрій що може записувати певний звук і розпізнавати у звуковому потоці раніше записаний звук. Під розпізнаванням розуміється процес визначення подібності записаного і отриманого звуків, і реакція на це, якщо ступінь подібності є високою. Такий пристрій має працювати в режимі реального часу, при чому в бажано для найкращого розпізнавання необхідно виконувати розпізнавання сигналу після кожного отриманого відліку вхідного сигналу. Однак виникає проблема із наявністю мікросхем що здатні розпізнавати певний звук в режимі реального часу і бути частино складного пристрою. Об’єкт дослідження – пристрої для розпізнавання сигналів. Предмет дослідження - спосіб реалізації пристрою для розпізнавання сигналу на базі ПЛІС. Мета дослідження: Розробити програмний модуль для розпізнавання цифрових звукових сигналів для на базі ПЛІС що зможе розпізнавати звуковий сигнал послідовний у часі з частотою дискретизації в 44.1 КГц в режимі реального часу. Робота складається з чотирьох розділів, а саме: актуальність і наявні рішення, проектування алгоритму і проектування структурної схеми, проектування окремих блоків і цілого пристрою мовою Verilog, розрахунок економічної ефективності. У першому розділі розглянуто актуальність і наявні рішення. Було встановлено що розпізнавання звуку є актуальною галуззю це підтверджується великою кількістю публікації[1][2] стосовно даної теми. Також було розглянуто аналогічні існуючі рішення було знайдено що основні існуючі рішення є або ж готовими пристроями що спеціалізуються на розпізнаванні голосу або ж є рішеннями для телефонів. Рішення для телефонів в свою чергу спеціалізовані лише на розпізнавання існуючих звуків певних типів: музики[3], птахів, тощо. Однак вони виконують пошук по базі вже існуючих семплів. Також було встановлено що всі існуючі прилади використовують для розпізнавання так званий "звуковий відбиток"[4], на основі якого виконується розпізнавання звуку. У другому розділі було розглянуто теоретичне обґрунтування розпізнавання звуку. Було розглянуто теорію Фур’є перетворення і його недоліки для часового аналізу. Реалізовано алгоритм розпізнавання звуку а також було написано його на мові Матлаб і мові Сі. Алгоритм складається з наступних дій: оцифрування вхідного сигналу, накладання вагового вікна, виконання швидкого перетворення Фур’є, обрахування модуля ШПФ, обрахування кореляції, порівняння результату кореляції із ваговим вікном. Розроблено блок схему пристрою для розпізнавання сигналів на базі алгоритму. У третьому розділі було спроектовано та проаналізовано такі блоки пристрою для розпізнавання звуку: перетворювач двійкового коду в слово, регістр зсуву, вагове вікно, швидке перетворення Фур’є, обрахунок модуля комплексного числа, корелятор, пам’ять шаблонного сигналу. Для цього було обрано алгоритм проектування і спроектовано усі блоки згідно нього. Аналіз блоків проводився за допомогою тестових модулів і аналізу часових діаграм Також було спроектовано цілісну схему пристрою і розглянуто її часові діаграми. В четвертому розділі проведено розрахунок економічної ефективності та наукової результативності проведеного дослідження. У результаті виконання роботи було спроектовано алгоритм роботи розпізнавання звуків і блок розпізнавання звуку. Алгоритм дозволяє розпізнавати сигнал у частотній області, для зменшення кількості гармонік застосоване вагове вікно що сумує певні гармоніки. Реалізована схема повторює алгоритм і дозволяє розпізнавати сигнал у режимі реального часу. Схема складається з окремих блоків кожен з яких реалізує певну функцію. Також частина блоків таких як: регістр зсуву, корелятор, пам’ять шаблонного сигналу - підтримують каскадування що дозволяє конфігурувати ядро для розпізнавання сигналу різної довжини. Запропонована реалізація має такі особливості: використання спектрограм для розпізнавання звуку, ітеративна структура, використання прямого множення і відсутність масштабування сигналу, відносно проста конфігурація. Загальний час виконання перетворення склав 30 тактів що дозволяє розпізнавати сигналу в режимі реального часу. Ключові слова – розпізнавання звуку, розпізнавання сигналу, ПЛІС, Verilog, ModelSim Перелік використаних літературних джерел. 1. Nitin Washani, Sandeep Sharma. Speech Recognition System: A Review. International Journal of Computer Applications 115(18) 2015. С. 7-10. 2. Shipra J.Arora, Rishi pal Singh. Automatic Speech Recognition: A Review. International Journal of Computer Applications 60(9) 2012. С. 34-44. 3. Avery Wang. The Shazam music recognition service. Communications of the ACM 49(8) 2006. 4. P. Cano, E. Batle, T. Kalker, J. Haitsma. A review of algorithms for audio fingerprinting. IEEE Workshop on Multimedia Signal Processing 2002.