Xuedong Huang, a Microsoft beszédfelismerésért felelős vezető szakembere jellemezte ezekkel a szavakkal a legújabb eredményüket, amivel elérték, hogy a beszédfelismerő program már majdnem ugyanolyan jól érti az elhangzott szavakat, mint egy valódi ember.

A program, ami hamarosan felbukkanhat a Cortana személyi asszisztensben és az Xboxokban is, 5,9 százalékos hibaaránnyal dolgozik, ami a Microsoft szerint "közel azonos" azzal, amit ugyanazoknál a szövegeknél a profi fordítók vétettek.

A Microsoft neurális modellt használ a beszédfelismeréshez, amely a hasonló szavak csoportokba rendezésével megkönnyíti a szavak általános értelmének kialakítását.

Ez persze csak a munka egyik fele, ugyanis ahhoz, hogy a beszédfelismerő tényleg hibátlanul működjön, nem elég, ha laboratóriumi körülmények között prímán felismeri a hibátlanul kiejtett szavakat, de "valós" élethelyzetekben, például zajos környezetben, vagy nem tökéletes kiejtéssel is ugyanilyen jól kell működnie.

Támogatott és ajánlott tartalmaink

ChatGPT-vel írt ítélettervezetet egy spanyol bíró, megbüntették

Csendben átveszi az uralmat a mesterséges intelligencia: ha ez a szakmád, te is veszélyben vagy

Totális háborúra készül a Meta, saját appal megy neki a Snapchatnek és a BeRealnek

A Player kérdése: Hogy alakul neked eddig 2026?
39% Tök jól, elégedett vagyok.
39% Semmi extra eddig.
22% A vártnál rosszabbul.