Что делает твой голос твоим?

Два исследователя из Калифорнийского университета в Лос-Анджелесе, Калифорния, Патрисия Китинг и Джоди Крейман, объединяют усилия (как они уже делали много раз в прошлом), чтобы применить инструменты акустики в своих лингвистических исследованиях, исследуя этот вопрос. Китинг и Крейман представят предварительные результаты своих исследований на 172-м заседании Акустического общества Америки и 5-м совместном совещании с Акустическим обществом Японии, которое состоится 28 ноября — декабрь. 2 августа 2016 года в Гонолулу, Гавайи.

По сути, Китинг и Креймен хотят узнать, как измерить, как звучат люди. «Невозможно количественно определить, что это означает», — сказал Крейман. «Когда вы меняете что-то физическое, можете ли вы предсказать, как это будет звучать?»Голос отдельного человека может со временем меняться из-за его эмоционального состояния, здоровья, контекста разговора или множества других факторов, которые особенно затрудняют количественную оценку этого измерения.

Большой объем данных из фонетики, когнитивной психологии и нейропсихологии показывает, что слушатели организуют всю эту вариативность внутри говорящего в прототип для каждого говорящего — «среднее» представление — и набор отклонений от этого прототипа. Даже один слог может нести достаточно информации, чтобы отличить один голос от другого, но пока неясно, какие именно наиболее важные идентифицирующие характеристики в таком прототипе или насколько каждая характеристика должна измениться, прежде чем голос станет неузнаваемым.«Качество голоса ухудшится, — сказал Китинг. «Мы смотрим на точку, когда вы перестанете походить на себя и начнете походить на кого-то другого».Китинг и Крейман в цифровом виде проанализировали записи пятидесяти женщин, носителей английского языка, которые прочитали пять предложений дважды в три разных дня.

Этот анализ рассматривал несколько акустических параметров для гласных и согласных звуков, составляющих прочитанные предложения, такие как основная частота, интенсивности гармонических частот относительно друг друга и их сравнение с уровнями основного шума в голосе.Эти предложения предоставили каждой характеристике количественное среднее значение и диапазон, совокупность которых сформировала своего рода потенциальный идентифицирующий голосовой профиль. Сравнивая всех динамиков с этим набором характеристик — профилем голоса конкретного человека — с использованием случайного набора их примеров предложений, можно проверить точность определения правильного говорящего и сравнить с тем, насколько хорошо действуют другие наборы характеристик. различать определенный голос.

Эта работа расширяет предыдущую работу, которую они успешно завершили, с образцом всего из трех спикеров. Больший размер выборки позволяет лучше понять, какие характеристики и в какой степени делают узнаваемый голос неузнаваемым. Вот почему набор образцов состоял из одинаковых носителей английского языка, все женщины и носители английского языка.

«Кого следует сбивать с толку и при каких обстоятельствах?» — спросил Крейман. «Насколько ощутимы акустические изменения?» Заглядывая в будущее, ответы на эти вопросы могут помочь в создании прогнозов о путанице в контексте как слушателей-людей, которые, как правило, способны различать распознаваемые данные за считанные секунды, так и компьютерных алгоритмов, для которых обычно требуются образцы длиной ближе к минуте.