Подробности

    ЦифроМахИнтеллектИскусственный интеллект → Компоненты биометрических систем

    Компоненты биометрических систем

    распознавание текста

    Распознавание голоса

    Распознавание голоса является технологией, которая позволяет пользователю применять свой голос в качестве устройства ввода данных. Распознавание голоса может использоваться для диктования текста компьютеру или для подачи команд компьютеру (например, для открытия программных приложений, развертывания меню или сохранения работы). Более ранние системы распознавания голоса требуют отчетливого произношения каждого слова с заметными промежутками. Это позволяет машине определять, где заканчивается одно слово, и начинается следующее. Такие виды программ распознавания речи все еще применяются для управления компьютерными системами и работы с такими приложениями, как веб-браузеры или электронные таблицы.

    Более современные приложения распознавания голоса позволяют пользователю бегло диктовать текст компьютеру. Такие новые приложения способны распознавать речь со скоростью до 160 слов в минуту. Приложения, которые позволяют распознавать непрерывный поток речи в основном предназначены для распознавания и форматирования текста, а не для управления самой компьютерной системой. В технике распознавания речи используется нейронная сеть для «обучения» распознаванию человеческого голоса. В то время как вы говорите, программное обеспечение распознавания речи запоминает, каким образом вы произносите каждое слово. Такая индивидуализированная настройка позволяет производить распознавание голоса, несмотря на то, что у всех людей разное произношение и интонация.

    Помимо «изучения» того, как вы произносите слова, системы распознавания голоса также используют грамматический контекст и частоту употребления отдельных слов для того, чтобы предугадать, какое слово вы желаете ввести. Такие мощные статистические средства позволяют программе найти в обширной языковой базе данных нужное слово до того, как вы его произнесете.
    Но хотя за последние несколько лет точность распознавания речи улучшилась, некоторые пользователи все еще испытывают проблемы неточной передачи речи, связанные либо с какими-то особенностями речи, либо с характером их голоса.



  • Технологический институт

    Более прогрессивным вариантом является, конечно, методика интеллектуального обучения машины, когда робот повторяет движения человека и даже их последовательность

     
  • Источник: http://vestnikatp.wordpress.com