XX Открытая конференция студентов-филологов в СПбГУ

Влияние переходных процессов на естественность речевого сигнала

Павел Андреевич Холявин
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Анна Дмитриевна Мамушина
Докладчик
сотрудник
Санкт-Петербургский государственный университет
Евгения Андреевна Захарченко
Докладчик
студент 4 курса
Санкт-Петербургский государственный университет

157
2017-04-18
12:40 - 13:00

Ключевые слова, аннотация

Цель исследования — изучить влияние изменения индивидуальных голосовых характеристик на естественность речи. Была проведена подготовка материала: в двух записях речи в несколько этапов была выполнена взаимная замена всех звуков, кроме глухих шумных согласных. Далее проводился слуховой анализ этого материала. Результаты экспериментов показали, что такие изменения в разной степени влияют на естественность звучания в зависимости от их масштаба. На основе исследования возможно улучшение существующих методов распознавания речи.

Тезисы

Цель данной работы — исследовать влияние индивидуальных голосовых характеристик на восприятие, выяснить, какие из них наиболее значимы для опознавания конкретного диктора и в целом для того, чтобы речь была понятной и легко воспринимаемой на слух. 
Для этого были использованы записи фонетически представительного текста двух дикторов (мужчины и женщины), сделанные на кафедре фонетики и методики преподавания иностранных языков Санкт-Петербургского Государственного Университета. Обработка данных речевых сигналов производилась в программе WaveAssistant в соответствии с принципами, описанными в работе П. А. Скрелина «Сегментация и транскрипция». Таким образом, была проделана следующая работа: сегментация сигналов на звуки с подписью каждого звука по системе, описанной в таблице основных аллофонов, разработанной на кафедре фонетики и методики преподавания иностранных языков. Далее проводилась поэтапная замена: гласных в записи мужского голоса на соответствующие гласные из записи женского голоса и наоборот; сонантов в записи мужского голоса на соответствующие сонанты из записи женского голоса и наоборот; звонких согласных в записи мужского голоса на соответствующие звонкие согласные из записи женского голоса и наоборот. Также был выполнен слуховой анализ полученных сигналов, сравнение их с исходными записями.
Проведенное исследование показало, что, чем меньше участков, где присутствует голос исходного диктора, остается в обрабатываемой записи, тем более звучание приближается к речи второго диктора. Таким образом, можно сделать вывод, что именно основной тон в наибольшей степени формирует представление о речи конкретного человека и позволяет распознать его голос. Тем не менее полного соответствия не наблюдается, так как в полученном сигнале по-прежнему присутствуют глухие согласные исходного диктора, а также такие индивидуальные характеристики, как длительность звуков. 
Таким образом, данная тема требует дальнейшего исследования и проведения экспериментов (напр., сравнение обработанного сигнала с исходным и выяснение степени схожести, отнесение обработанного сигнала к исходному/второму диктору/ни одному из них) с участием носителей русского языка, а также дальнейшей обработки сигнала (главным образом, основного тона) с целью выяснить влияние мелодики на опознавание диктора другими носителями языка.