A Show and Tell nevű képfelismerő algoritmus nem csak 94%-os pontossággal azonosítja a képen látható dolgokat, de azok méretéről, színéről, és helyzetéről is részletesen beszámol.

Ijedezni azért nincs okunk, hiszen olyan világvége-teóriával még senki sem állt elő, amiben az emberiség pusztulását egy képfelismerő algoritmus okozza, de az biztos, hogy a fejlődés egészen elképesztő. Főleg, ha olyan programokhoz hasonlítjuk, mint a NeuraTalk vagy a The Wolfram Language, amelyek azért elég nagy hibaaránnyal dolgoznak.

Ennyit fejlődött a Google képfelismerő programja két év alatt

A Google képfelismerője az utóbbihoz hasonlóan szintén a hús-vér emberek által leírt képekből tanul, és 94%-os pontossággal találja el, hogy mi van a képen. Ráadásul nem csak azt, hogy "labda", vagy "tömeggyilkos", hanem az egész képet képes kontextusba helyezni.

Íme egy példa: a mesterséges intelligenciának kutyás-tengerpartos tematikájú képek felismerését akarták megtanítani, így a programozók olyan képeket mutattak neki, mint az "aranyos kiskutya ül egy tengerparti homokba rajzolt szívben", és "egy nagy barna kutya egy kiskutya mellett néz ki az ablakon".

A program pedig ezután már magától képes volt részletesen leírni egy hasonló, de korábban még soha nem látott képet, amelyen a megállapítása szerint az látható, hogy "egy kutya üldögél a tengerparton egy másik kutya mellett". És valóban, ennél szebben mi sem tudtuk volna elmondani, hogy mi látható a fotón.

Támogatott és ajánlott tartalmaink

A jövő, ahol 100 az új 60 – a hosszú élet titka egyszerűbb, mint gondolnánk

Felvételen, hogy mi történik, ha egy üstökös túl közel merészkedik a Naphoz

Középkori „vámpír” arcát rekonstruálták horvát kutatók

További cikkeink a témában
A Player kérdése: Hány éve dolgozol a jelenlegi munkahelyeden?
8% Kevesebb mint egy éve
20% 1-3 éve
22% 4-7 éve
11% 8-10 éve
39% +10 éve