Az OpenAI bemutatta a legismertebb generatív mesterséges intelligencia, a ChatGPT soron következő verzióját, a GPT-4o-t. A szoftver elképesztő természetességgel beszél, és rögtön tud hangban, szövegben és képben működni.
Az eszközök millióin jelen lévő digitális asszisztensek, az Alexa, a Google Segéd vagy a Siri fejlesztői évek óta ígérik, hogy egyszer, a nem túl távoli jövőben szinte bármit kérünk a telefonunktól vagy a számítógépünktől, az a legnagyobb természetességgel meg is történik. És nem, nem csak arra lesz képes a mobilunk, hogy félig robot, félig ember hangon visszaigazolja, hogy lekapcsolta a nappaliban a villanyt, vagy beállította a főzéshez használt visszaszámlálót. Álmainkban-rémálmainkban, valamint a technológiai nagyvállalatok vízióiban Spike Jonze A nő (Her) című filmje jelenik meg, amelyben a főhőst mindenhova elkíséri búgó hangú, alig érzékelhetően digitális társa.
Tegnapelőtt az OpenAI közelebb vitt minket ehhez, mint eddig bárki.
Mira Murati, a cég technológiai vezetője egy félórás prezentációban bemutatta a ChatGPT új verzióját, ami a a GPT-4o nevet kapta. Az „o” betű az omnit jelöli, hiszen már nem egy többlépcsős folyamat felel azért, hogy a kérdéseinkre választ kapjunk. Eddig ugyanis három rendszer dolgozott össze a háttérben: az élőbeszédet, azaz a szavainkat feldolgozó, a kérdést megértő és a választ megalkotó, illetve az így keletkezett szöveget hanggá alakító szoftver. Ez mostantól egy helyen történik, ami sokkal gyorsabb, természetesebb interakciókat tesz lehetővé. A fentebb linkelt videóban 22:35-től a GPT-4o például folyamatosan tolmácsol olaszról angolra és vissza két OpenAI-os munkatárs között, miután már egyenleteket oldott meg és az egyik, izguló szakembert megtanította lassan, nyugodtan lélegezni a színpadon. De mindez nem csak egy előre lepróbált helyzetben működik: a „rejtélyes mesterséges intelligencia”, amely „gpt2-chatbot” álnéven kápráztatta el a felhasználókat egy MI-összehasonlító oldalon, bizony a GPT-4o volt.
A területen zajló versenyt pedig jól mutatja, hogy ezt az új modellt nem csak az előfizetőinek teszi elérhetővé a cég.
A technológiai vezető ugyanis azt is bejelentette, hogy a személyre szabott GPT-ket gyűjtő GPT Store, és a GPT-4o is mindenki számára elérhető lesz. Utóbbi esetben annyi a fizető felhasználók előnye, hogy nagyobb kapacitással tudják használni a szoftvert. A következő hetekben az Apple és a Google is megtartja éves fejlesztői konferenciáját – azt csak a főhadiszállásaikon tudják, hogy az OpenAI prezentációja után megijedniük vagy ünnepelniük érdemes-e.
Ez is érdekelhet: