Az OpenAI bemutatta a legismertebb generatív mesterséges intelligencia, a ChatGPT soron következő verzióját, a GPT-4o-t. A szoftver elképesztő természetességgel beszél, és rögtön tud hangban, szövegben és képben működni.

Az eszközök millióin jelen lévő digitális asszisztensek, az Alexa, a Google Segéd vagy a Siri fejlesztői évek óta ígérik, hogy egyszer, a nem túl távoli jövőben szinte bármit kérünk a telefonunktól vagy a számítógépünktől, az a legnagyobb természetességgel meg is történik. És nem, nem csak arra lesz képes a mobilunk, hogy félig robot, félig ember hangon visszaigazolja, hogy lekapcsolta a nappaliban a villanyt, vagy beállította a főzéshez használt visszaszámlálót. Álmainkban-rémálmainkban, valamint a technológiai nagyvállalatok vízióiban Spike Jonze A nő (Her) című filmje jelenik meg, amelyben a főhőst mindenhova elkíséri búgó hangú, alig érzékelhetően digitális társa.

Tegnapelőtt az OpenAI közelebb vitt minket ehhez, mint eddig bárki.

Mira Murati, a cég technológiai vezetője egy félórás prezentációban bemutatta a ChatGPT új verzióját, ami a a GPT-4o nevet kapta. Az „o” betű az omnit jelöli, hiszen már nem egy többlépcsős folyamat felel azért, hogy a kérdéseinkre választ kapjunk. Eddig ugyanis három rendszer dolgozott össze a háttérben: az élőbeszédet, azaz a szavainkat feldolgozó, a kérdést megértő és a választ megalkotó, illetve az így keletkezett szöveget hanggá alakító szoftver. Ez mostantól egy helyen történik, ami sokkal gyorsabb, természetesebb interakciókat tesz lehetővé. A fentebb linkelt videóban 22:35-től a GPT-4o például folyamatosan tolmácsol olaszról angolra és vissza két OpenAI-os munkatárs között, miután már egyenleteket oldott meg és az egyik, izguló szakembert megtanította lassan, nyugodtan lélegezni a színpadon. De mindez nem csak egy előre lepróbált helyzetben működik: a „rejtélyes mesterséges intelligencia”, amely „gpt2-chatbot” álnéven kápráztatta el a felhasználókat egy MI-összehasonlító oldalon, bizony a GPT-4o volt.

A területen zajló versenyt pedig jól mutatja, hogy ezt az új modellt nem csak az előfizetőinek teszi elérhetővé a cég.

A technológiai vezető ugyanis azt is bejelentette, hogy a személyre szabott GPT-ket gyűjtő GPT Store, és a GPT-4o is mindenki számára elérhető lesz. Utóbbi esetben annyi a fizető felhasználók előnye, hogy nagyobb kapacitással tudják használni a szoftvert. A következő hetekben az Apple és a Google is megtartja éves fejlesztői konferenciáját – azt csak a főhadiszállásaikon tudják, hogy az OpenAI prezentációja után megijedniük vagy ünnepelniük érdemes-e.

Ez is érdekelhet:

Egyedülálló egysejt-analitikai eljárást dolgoztak ki szegedi kutatók

A módszerrel az egyes sejtek szintjén kifejeződő egyedi jellegeket, fenotípusokat elemzik az MI segítségével.

Eszelős, mit művelt egy képalkotó MI Teréz anyával

„Teréz anya harcol a szegénység ellen” – szólt a prompt, a megoldást a cikkben mutatjuk.

Megkértük a mesterséges intelligenciát, hogy írjon dalt a cikkeinkből, és az eredmény zseniális lett

Nőkről, autókról, és még a kilencvenes évekről szóló cikkekből is alkotott zenét a mesterséges intelligencia, és lehet, hogy elfogultak vagyunk, de szerintünk elég jók lettek a számok.

Támogatott és ajánlott tartalmaink

Az Asus dobja piacra elsőként az AI-laptopok új generációját

Szaftos húsokért, bomba jó sörökért és lazán elegáns hangulatért ide kell beülnöd

Földi életre alkalmasnak tűnő bolygót találtak, ráadásul a szomszédban

További cikkeink a témában