Общая оценка современного состояния автоматического распознавания речи
Несмотря на значительные успехи, достигнутые в последнее десятилетие, исследователям, которые занимаются разработкой систем, распознающих человеческую речь, еще многое предстоит сделать. На недавнем международном конгрессе фонетических наук известный специалист в этой области В. Атал подвел некоторые итоги проведенных исследований [Atal 1995]. На рис. 11.6 показаны оценки успешности и надежности распознавания речевых сообщений разного типа в зависимости от размеров машинного словаря. На рисунке под диагональю помещены задачи, которые уже сейчас успешно и надежно решаются с помощью систем распознавания речи, а выше диагонали – задачи, которые находятся в стадии лабораторных разработок. Как видно из рисунка, распознавание слитной речи даже в режиме диктовки не достигло еще такого уровня надежности, который имеют системы распознавания небольшого набора слов и словосочетаний. В то же время ясно, что в ближайшее десятилетие задача распознавания и понимания естественной речи любого говорящего будет занимать центральное место в речевых технологиях.

Спонтанная
речь
Чтение связного текста
Т
И
ПЫ
Р
Е
Ч
Е
ВЫХ
СОО
Б
ЩЕ
НИЙ
Естественный диалог
Числовые последователь-ности
Команды
Диктовка
20
200
2000
20000
Р
Подготовленная связная речь
Ключевые слова
ис.
Произнесение словосочетаний
Собственные имена
Произнесение отдельных слов
РАЗМЕР внутреннего словаря системы (количество слов)
Рис. 11.6. Современное состояние разработок в области автоматического распознавания речи
ЛИТЕРАТУРА к ГЛАВЕ 11
Галунов В.И., Родионов В.Д. Моделирование процесса передачи информации в звуковом диапазоне. Л., 1988.
Деркач М.Ф., Гумецкий Р.Я., Гура Б.М., Чабан М.Е. Динамические спектры речевых сигналов. Львов, 1983.
Зиновьева Н.В. Система акустических ключей к распознаванию фонетических единиц русского языка // Экспериментальная фонетика. М., 1989.
Зу (Цзуэ) В.В. Лингвистический подход к автоматическому распознаванию речевых сигналов // Труды института инженеров по электротехнике и радиоэлектронике (ТИИЭР). Речевая связь с машинами. 1985, 73.
Клэтт Д.Х. Основные результаты работ по проекту ARPA // Методы автоматического распознавания речи. М. 1983, 1.
Лобанов Б.М., Панченко Б.В. Модель фонемно-артикуляторного синтеза речи // Модели речевого процесса в норме и патологии. Л., 1980.
Методы автоматического распознавания речи / Под ред. А. У. Ли. М., 1983.
Мясников Л.Л. Звуки речи и их объективное распознавание // Вестник ЛГУ. 1946, 3.
Обжелян Н.К., Трунин-Донской В.Н. Машины, которые говорят и слушают. Кишинев, 1987.
Потапова Р.К. Речь: коммуникация, информация, кибернетика. М., 1997.
Cole R., Rudnicky A., Zue W., Reddy D. Speech as patterns on paper // Perception and Production of fluent Speech. N. J., 1980.
Dudley H., Riesz R., Watkins S. “A Synthetic Speaker” // Journal of the Franklin Institute. 1939, 227. P.739–764.
Dutoit T. An Introduction to Text-to-Speech Synthesis. Dordrecht, 1997.
Klatt D.H. Software for a cascade/parallel formant synthesizer // JASA. 1980, V.67. P. 971–995.
Stevens K.N. Control parameters for synthesis by rule // Proc. of the ESKA Tutorial Day on Speech Synthesis. Autrans, 1990.
Machoul J., Schwarz R. State of the art in continuous speech recognition // Voice communication between humans and machines. Washington, 1994.
Atal B. Speech Recognition by Machines // Proc. of the XIII Int. Congress of Phonetic Sciences. Stockholm, 1995.
Поделитесь с Вашими друзьями: |