Психоакустика
сигнала к уровню шума (для студий звукозаписи он должен соответствовать кривой NC-15) (рис.1), небольшое
время реверберации (в пределах до 1,1 с) и структура отражений, характеризующаяся отсутствием эха и
наличием интенсивных ранних отражений при низком уровне поздних.
133
Рис. 1 Стандартизированные кривые уровня шумов NC
Влияние реверберационного процесса на структуру речевого сигнала можно отчетливо увидеть на примере
осциллограмм, записанных в заглушенной камере и в помещении с большим значением реверберации (рис.2).
Естественно, что при таком существенном изменении временной структуры речевого сигнала процесс его
распознавания существенно ухудшается.
Рис. 2 Осциллограмма речевого сигнала
в заглушенной камере и в помещении
Существующие в настоящее методы объективной оценки разборчивости в той или иной степени связаны с
перечисленными акустическими характеристиками. Кроме того, на разборчивость речи влияют параметры
системы звукоусиления, если она установлена в зале (рис.3), о чем уже было сказано в первой части статьи.
Рис. 3 Параметры системы звукоусиления,
влияющие на разборчивость
Объективные методы оценки разборчивости можно разделить на две группы.
134
Первая аддитивная группа базируется на том предположении, что результирующая разборчивость речи
определяется суммой вкладов в отдельных частотных полосах, а величина вклада зависит от отношения
сигнала к шуму в каждой полосе.
К этой группе относится несколько методов.
1. AI -Индекс артикуляции.
Использование индекса артикуляции было предложено Г. Флетчером в лаборатории Bell Telephone
Laboratories (США) в 1940 году.
Идея заключается в том, что весь частотный диапазон речевого сигнала разделяется на некоторое
количество полос (обычно на 20), в пределах которых определяется отношение сигнала к шуму.
Предполагается , что каждая частотная полоса вносит свой независимый вклад в разборчивость речи. Ширина
полос выбрана таким образом, чтобы вклад каждой полосы в результирующую разборчивость был
одинаковый.
В каждой полосе рассчитывается отношение «сигнал/шум», взвешивается и суммируется для получения
индекса артикуляции: АI = .AIj, где AI -индекс артикуляции, 0< АI <1; АIj -вклад в индекс в j-той полосе частот,
0 < АIj < 0,05. Причем, для отношения «сигнал/шум» больше 30 дБ значение АIj принимается равным 0,05, а
для отношения «сигнал/шум» меньше 30 дБ эти значения определяются как: АIj = 0,05(S/N)j/30. Отношение
сигнала к шуму в отдельных полосах частот определяется по пиковым значениям речевого сигнала и по
эффективным величинам шума. Причем, в шум включаются все мешающие передаче речи сигналы: шумовой
фон помещения, реверберационная составляющая речевого сигнала и шум электроакустического тракта.
Рис. 4 Соотношение между разборчивостью
и индексом артикуляции AI
Значения AI ниже 0,3 соответствуют плохой разборчивости; от 0,3 до 0,5 -удовлетворительной; 0,5…0,7 хорошей;
выше 0,7 -очень хорошей. Соотношение между артикуляционным индексом и словесной
разборчивостью для английской речи показано на рисунке 4. Как следует из определения, основное влияние
на величину индекса артикуляции оказывает уровень шумов в помещении, примеры распределения значений
AI в разных точках аудитории при уровне шумов, соответствующих кривым NC-50 и NC-35, представленных на
рис.1, показаны на рис.5а и 5б.
135
Рис. 5 Распределение индекса артикуляции
AI
в разных точках аудитории
при разном уровне шумов: a-NC-50; б-NC-35
Страниц: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159
Отзывов (0)