Идентификация человека по голосу
Доклад, 17 Декабря 2011, автор: пользователь скрыл имя
Описание
Презентация на тему "Идентификация человека по голосу".
Работа состоит из 1 файл
Распознавание голоса человека.pptx
— 1.61 Мб (Скачать документ)Идентификация
человека по голосу:
- Узнать собеседника
- Определить психическое состояние
Методы
идентификации
42 фонемы:
“Огласованные”
"э", "о", "л", "и" ,"а" и т.д.
“Шипящие”
"ц", "ч",
"ш", "щ" и т.д.
Пример голосовой фразы и выделения из неё 8 фрагментов.
- огласованная фонема
- шипящая(шумоподобная)
- колебания одной фонемы для одного человека
- другого человека
Биометрическая
идентификация
- I подход.
Индивидуальные различия
распределения мощности сигнала по спектру
Амплитудно-частотная
характеристика
Ошибки - 1-5%
- Индивидуальные различия строятся на базе гребёнки узкополосных фильтров, выделяющих из голоса колебания разных частот.
- Полосы пропускания фильтров выбираются оптимальными(16 фильтров), чтобы не зависеть от вариаций частотного спектра голоса.
- Системы спектрального анализа голоса обучаются, запоминая распределение энергий с частотой порядка 35 миллисекунд.
- Данные снимаются с частотой 16кГц и в 16 разрядов (связано с особенностями фильтров).
- Итоговый массив данных маленького размера (нужно записать только 16 координат вершин по одной оси).
- Для идентификации можно использовать как статистические методы, так и нейронную сеть(не влияет на результат распознавания).
Особенности:
Биометрическая
идентификация
- II подход
Использование
аппарата линейного
Использование цифрового
колебательного фильтра в качестве
колокола
Ошибки от 0,00000001%
до 1%
- Огласованные колебания звука имитируют периодическими ударами по колебательному звену (колоколу). Период ударов соответствовует периоду основного тона голоса.
- Число коэффициентов фильтра колеблется от 10 до 12 (а1,..., а12).
- Коэффициенты линейного предсказателя вычисляются на выборке из 180-220 отсчётов ("ударов")
- Вычисление параметров предсказателя (цифрового фильтра) находят решением системы из 10...12 линейных уравнений. Для того, чтобы понизить вычислительную нагрузку частоту дискретизации понижают до 8 кГц.
- При имитации огласованных звуков на вход фильтра подают периодическую последовательность импульсов, промодулированную по амплитуде, при моделировании шипящих - случайный шум нужной амплитуды. На выходе - периодические переходные процессы, повторяющие моделируемый звук(массив данных из последовательности импульсов основного тона и коэффициентов линейного предсказателя)
Особенности:
Защита
от перехвата парольной фразы
- Использовании речевой информации, вводимой с ларингофона, контактирующего с телом говорящего.
(речевой
сигнал колебаниями
- сигнал, снятый с шейной зоны, - ключичной зоны
Оценка
биометрического метода
Достоинства:
- Привычный для человека способ идентификации.
- Низкая стоимость (самая низкая среди всех биометрических методов).
- Бесконтактность.
Недостатки:
- Высокий уровень ошибок 1 и 2 рода.
- Прохождения идентификации в шумоизолированном помещении.
- Возможность перехвата фразы "магнитофоном".
- Качество распознавания зависит от многих факторов (интонация, скорость произнесения, психологическое состояние, болезни горла).
- Необходимость подбора специальных фраз (С огласоваными фонемами).
Спасибо за внимание!