Xuedong Huang, a Microsoft beszédfelismerésért felelős vezető szakembere jellemezte ezekkel a szavakkal a legújabb eredményüket, amivel elérték, hogy a beszédfelismerő program már majdnem ugyanolyan jól érti az elhangzott szavakat, mint egy valódi ember.
A program, ami hamarosan felbukkanhat a Cortana személyi asszisztensben és az Xboxokban is, 5,9 százalékos hibaaránnyal dolgozik, ami a Microsoft szerint "közel azonos" azzal, amit ugyanazoknál a szövegeknél a profi fordítók vétettek.
A Microsoft neurális modellt használ a beszédfelismeréshez, amely a hasonló szavak csoportokba rendezésével megkönnyíti a szavak általános értelmének kialakítását.
Ez persze csak a munka egyik fele, ugyanis ahhoz, hogy a beszédfelismerő tényleg hibátlanul működjön, nem elég, ha laboratóriumi körülmények között prímán felismeri a hibátlanul kiejtett szavakat, de "valós" élethelyzetekben, például zajos környezetben, vagy nem tökéletes kiejtéssel is ugyanilyen jól kell működnie.