IBM снизили долю ошибок в компьютерном распознавании речи до 5,5% и это новый рекорд. Ранее ИИ компании показывали результат в 6,9%, а прежний рекорд алгоритма от Microsoft составил 5,9% ошибок. Для человека доля ошибок в распознавании речи равна примерно 5%.
Для технологий распознавания речи 5,1% — магическое число, и если процент ошибок системы приблизительно равен ему, это означает, что возможности технологии приблизились к человеческим — люди не разбирают примерно 5% слов в беглой речи.IBM объявили, о достижении результата в 5,5%, как пишет Business Insider. Это означает, что существенный прорыв в технологиях искусственного интеллекта, который «обитает» в виртуальных помощниках, таких как Siri, Alexa и Google Assistant, уже не за горами.
В 2016 году IBM работала над тем, чтобы побить свой прежний рекорд в 6,9% и снизить процент ошибок, компании с легкостью удалось осуществить это. ПО пока еще не может улавливать все нюансы речи, такие как ее тон или метафоры, однако, снижение доли ошибок при распознавании прямого значения слов — уже значительное достижение.
Осенью 2016 года исследователи из Microsoft рассказали о том, что в их системе распознавания речи частота ошибок составила 6,3%, тогда как у IBM данный показатель был на 0,3% хуже. Затем Microsoft добились цифры в 5,9%. Однако, сейчас IBM вышел в лидеры. По словам Джорджа Саона, исследователя IBM, компания ставит цель достичь процента ошибок в 5,1%, это приравняет машинное распознавание речи к человеческому.