A Show and Tell nevű képfelismerő algoritmus nem csak 94%-os pontossággal azonosítja a képen látható dolgokat, de azok méretéről, színéről, és helyzetéről is részletesen beszámol.
Ijedezni azért nincs okunk, hiszen olyan világvége-teóriával még senki sem állt elő, amiben az emberiség pusztulását egy képfelismerő algoritmus okozza, de az biztos, hogy a fejlődés egészen elképesztő. Főleg, ha olyan programokhoz hasonlítjuk, mint a NeuraTalk vagy a The Wolfram Language, amelyek azért elég nagy hibaaránnyal dolgoznak.
A Google képfelismerője az utóbbihoz hasonlóan szintén a hús-vér emberek által leírt képekből tanul, és 94%-os pontossággal találja el, hogy mi van a képen. Ráadásul nem csak azt, hogy "labda", vagy "tömeggyilkos", hanem az egész képet képes kontextusba helyezni.
Íme egy példa: a mesterséges intelligenciának kutyás-tengerpartos tematikájú képek felismerését akarták megtanítani, így a programozók olyan képeket mutattak neki, mint az "aranyos kiskutya ül egy tengerparti homokba rajzolt szívben", és "egy nagy barna kutya egy kiskutya mellett néz ki az ablakon".
A program pedig ezután már magától képes volt részletesen leírni egy hasonló, de korábban még soha nem látott képet, amelyen a megállapítása szerint az látható, hogy "egy kutya üldögél a tengerparton egy másik kutya mellett". És valóban, ennél szebben mi sem tudtuk volna elmondani, hogy mi látható a fotón.