IBM победила Microsoft в битве систем распознавания речи

Через несколько лет большинство известных нам электронных устройств будет управляться голосом. Потому что это наиболее функциональный интерфейс управления и при этом самый удобный для пользователей. Больше не будет нужно использовать клавиатуру, а также дополнительные аксессуары управления, так как будет достаточно просто произнести нужную команду, а оборудование начнет выполнять порученные ему задачи.

Прежде чем это произойдет необходимо доработать системы распознавания речи, чтобы наши команды были правильно поняты. Никто, в конце концов, не хочет, чтобы, вместо того, чтобы заблокировать электронные замки, система подумала, что мы хотим оставить их открытыми, приглашая тем самым грабителей.

В сентябре прошлого года Microsoft похвасталась, что сократила уровень ошибок в системе распознавания речи для всего 6,3 процента., побив рекорд IBM, который составлял 6,9 процента. Месяц спустя, гигант из Редмонда улучшил собственный рекорд, достигнув 5,9 процента.



Инженеры IBM резко взялись на работу и только что объявили, что им удалось снизить уровень ошибок до всего 5,5 процента, что уже очень близки к уровню человека. И это еще не последнее слово, ибо они утверждают, что в ближайшем будущем удастся его уменьшить до 5,1 процента.

Инженеры IBM добились этого за счет использования длинной кратковременной памяти и языковых моделей WaveNet.

А уровень ошибок был измерен с помощью инструментов SWITCHBOARD и CallHome, используемых несколько десятилетий для этой задачи.
Понравилась статья? Поделиться с друзьями:
Комментарии: 0