A Show and Tell nevű képfelismerő algoritmus nem csak 94%-os pontossággal azonosítja a képen látható dolgokat, de azok méretéről, színéről, és helyzetéről is részletesen beszámol.

Ijedezni azért nincs okunk, hiszen olyan világvége-teóriával még senki sem állt elő, amiben az emberiség pusztulását egy képfelismerő algoritmus okozza, de az biztos, hogy a fejlődés egészen elképesztő. Főleg, ha olyan programokhoz hasonlítjuk, mint a NeuraTalk vagy a The Wolfram Language, amelyek azért elég nagy hibaaránnyal dolgoznak.

Ennyit fejlődött a Google képfelismerő programja két év alatt

A Google képfelismerője az utóbbihoz hasonlóan szintén a hús-vér emberek által leírt képekből tanul, és 94%-os pontossággal találja el, hogy mi van a képen. Ráadásul nem csak azt, hogy "labda", vagy "tömeggyilkos", hanem az egész képet képes kontextusba helyezni.

Íme egy példa: a mesterséges intelligenciának kutyás-tengerpartos tematikájú képek felismerését akarták megtanítani, így a programozók olyan képeket mutattak neki, mint az "aranyos kiskutya ül egy tengerparti homokba rajzolt szívben", és "egy nagy barna kutya egy kiskutya mellett néz ki az ablakon".

A program pedig ezután már magától képes volt részletesen leírni egy hasonló, de korábban még soha nem látott képet, amelyen a megállapítása szerint az látható, hogy "egy kutya üldögél a tengerparton egy másik kutya mellett". És valóban, ennél szebben mi sem tudtuk volna elmondani, hogy mi látható a fotón.

Támogatott és ajánlott tartalmaink

Mi kell ahhoz, hogy a kutyád ne csak boldog legyen, de a legjobb barátoddá is váljon?

Összedőlt egy 2,5 kilométeres baltimore-i híd, miután nekiment egy konténerszállító hajó

A középkategória csúcsa – kipróbáltuk a Redmi Note 13 Pro+ 5G-t

További cikkeink a témában
Mi kell ahhoz, hogy a kutyád ne csak boldog legyen, de a legjobb barátoddá is váljon?
Hirdetés