A Show and Tell nevű képfelismerő algoritmus nem csak 94%-os pontossággal azonosítja a képen látható dolgokat, de azok méretéről, színéről, és helyzetéről is részletesen beszámol.

Ijedezni azért nincs okunk, hiszen olyan világvége-teóriával még senki sem állt elő, amiben az emberiség pusztulását egy képfelismerő algoritmus okozza, de az biztos, hogy a fejlődés egészen elképesztő. Főleg, ha olyan programokhoz hasonlítjuk, mint a NeuraTalk vagy a The Wolfram Language, amelyek azért elég nagy hibaaránnyal dolgoznak.

Ennyit fejlődött a Google képfelismerő programja két év alatt

A Google képfelismerője az utóbbihoz hasonlóan szintén a hús-vér emberek által leírt képekből tanul, és 94%-os pontossággal találja el, hogy mi van a képen. Ráadásul nem csak azt, hogy "labda", vagy "tömeggyilkos", hanem az egész képet képes kontextusba helyezni.

Íme egy példa: a mesterséges intelligenciának kutyás-tengerpartos tematikájú képek felismerését akarták megtanítani, így a programozók olyan képeket mutattak neki, mint az "aranyos kiskutya ül egy tengerparti homokba rajzolt szívben", és "egy nagy barna kutya egy kiskutya mellett néz ki az ablakon".

A program pedig ezután már magától képes volt részletesen leírni egy hasonló, de korábban még soha nem látott képet, amelyen a megállapítása szerint az látható, hogy "egy kutya üldögél a tengerparton egy másik kutya mellett". És valóban, ennél szebben mi sem tudtuk volna elmondani, hogy mi látható a fotón.

Támogatott és ajánlott tartalmaink

Megérkezett a nagyágyú: a CANAL+ belép a magyar streamingpiacra

Teljesen leállt Ferihegy az extrém téli időjárás miatt

Miért ónos eső az ónos eső, ha nincs benne ón? És akkor mi is ez valójában?

A Player kérdése: Neked bejött a négyévszakos gumi?
31% Igen, az én igényeimnek teljesen megfelel.
16% Nekem felejtős, számomra nem eléggé strapabíró.
53% Nincs tapasztalatom vele.