Распознавание речи для мобильных устройств Возможности голосового управления и общения на естественном языке наиболее привлекательны для рынка всевозможных миниатюрных и мобильных систем. Клавиатуры портативных компьютеров слишком малы и неудобны для быстрой работы с текстом.
Однако программы распознавания речи в мобильных устройствах решают, как правило, более специализированные задачи, нежели универсальное распознавание слитной речи, поэтому сегодня они уже применяются довольно успешно. А увеличение вычислительных мощностей мобильных устройств позволяет создавать весьма продвинутые программы с расширенными функциями распознавания речи. Среди таких приложений давно известна программа Microsoft Voice Command, которая управляет различными приложениями при помощи голоса (например, можно включить воспроизведение музыки в плеере или создать новый документ), Apple Speech Recognition Manager (которая работает на любом компьютере Macintosh или PowerBook) или Speereo Voice Translator (голосовой переводчик), способный распознавать фразы, произнесенные на английском языке, и проговаривать перевод на одном из выбранных языков.
А в 2008 году компания Microsoft вышла на рынок с новой технологией Sync, которая позволяет объединять КПК, МРЗ-плееры и телефоны с поддержкой Bluetooth, предоставляя пользователю широкие возможности по голосовому управлению всеми цифровыми гаджетами.
Особенно часто подобные технологии используются для голосового управления функциями мобильных устройств в условиях ограниченного применения других интерфейсов. Широко используются также различные приложения для идентификации говорящего по образцу речи (например, при организации доступа к мобильному компьютеру и/или каким-то данным). Сегодня такие решения уже широко доступны для различных категорий клиентов (частных, корпоративных, разработчиков) и реализованы для различных платформ.
Тем не менее, даже самые продвинутые современные мобильные устройства, которые обеспечивают независимое от говорящего распознавание речи (то есть пользователь не должен создавать собственные образцы команд) и предикативный набор (то есть система пытается по своей базе определить, какое слово или фразу вы пытаетесь произнести), имеют ограниченные возможности, и пользователь вынужден выбирать команды из не слишком обширного предлагаемого списка.
Однако такие системы получают все более широкое распространение, а дальнейшее развитие и распространение подобных систем безусловно связывают с успехами в области распознавания живой речи. Пока эффективность работы последних (даже многомодальных и не зависящих от голоса абонента) существенно зависит от фоновых шумов, объема предикативного словаря, ясности речи говорящего и, естественно, мощности обрабатывающего процессора (которая, впрочем, постоянно увеличивается). Кроме того, к развитию этих технологий, безусловно, может подтолкнуть необходимость идентификации пользователя для обеспечения безопасности там, где по каким-либо причинам неудобно использовать другие средства идентификации. Кроме того, распознавание речи необходимо развивать для управления различными бытовыми роботами, которые сегодня переходят из области развлечений в утилитарную сферу бытовых устройств.
Что касается русскоязычных программ, то можно отметить белорусскую компанию «Сакрамент» (http://www.sakrament.com), которая является сегодня одним из ведущих разработчиков русскоязычного ПО в области распознавания русской и английской речи (идентификация голоса, индексация аудио и пр.), а также обработки речи (синтез русской и английской речи — озвучивание текстов).
Есть на российском рынке и другие продукты для КПК с поддержкой распознавания русской речи. Например, компания «Лингвобит», хорошо зарекомендовавшая себя качественной локализацией мобильных операционных систем, предлагает программу-разговорник ЕСТАСО Partner Voice Translator, которая обладает возможностью распознавания русской речи.