Алгоритм автоматической сегментации фрагментов речи в системе «человек – машина»

Смирнов В. М., Филатов В. Н.

Читать статью полностью

  Алгоритм автоматической сегментации фрагментов речи в системе «человек – машина»(1,85 MB)

Аннотация

В статье рассматриваются возможности и перспективы использования устной речи в современных системах «человек – машина» на обитаемых космических станциях. Для сегментации речевого сигнала с целью выделения фрагментов фонем русского языка предлагается использование кратномасштабного вейвлет-преобразования Добеши. Для более точного определения границ предлагается проводить постобработку для обнаружения «сильных» и «слабых» границ. Приводятся результаты экспериментальных исследований предложенного алгоритма сегментации различных по сложности произношения слов.

Ключевые слова:

речь – speech; фонема – phoneme; сегментация – segmentation; вейвлет-преобразование – wavelet-transformation; кратномасштабный анализ – discrete analise;вейвлет Добеши – wavelet Daubechies

Список литературы

1. Скрипник, Я. Н. Фонетика современного русского языка / Я.Н. Скрипник, Т.М. Смоленская; под ред. Я.Н. Скрипник. – Ставрополь: Изд–во СГПИ, 2010. – 148 с.

2. Separation of Voiced and Unvoiced Using Zero Crossing Rate and Energy of the Speech Signal / R.G. Bachu [et al.] // American Society for Engineering Education (ASEE) Zone Conference Proceedings, 2008. – P. 1–7.

3. Moattar, M. H. A simple but efficient real-time voice activity detection algorithm / M.H. Moattar, M.M. Homayoonpoor // 17th European Signal Processing Conference (EUSIPCO 2009). Glasgow, Scotland, 2009. – P. 2549–2553.

4. Mattias, N. Entropy and Speech / N. Mattias // Sound and Image Processing Laboratory School of Electrical Engineering KTH (Royal Institute of Technology). Stockholm, 2006. – 54 p.

5. Jancovic, P. Estimation of Voicing-Character of Speech Spectra Based on Spectral Shape / P. Jancovic, M. Kokuer // IEEE Signal Processing Letters. – 2006. – Vol. 14, No. 1. – P. 66–69.

6. Демидов, А. Е. Использование меры спектрального перехода для сегментации речевого сигнала / А.Е. Демидов, В.М. Смирнов // Материалы 66 Международной студенческой научной конференции ГУАП, СПб, 2013. – С. 119–122.

7. Ahmadi, S. Cepstrum-Based Pitch Detection Using a New Statistical V/UV Classification Algorithm / S. Ahmadi, A.S.