Már több mint ezer nyelvet beszél a mesterséges intelligencia

Ez a cikk már több mint 90 napja készült. A benne szereplő információk elavultak lehetnek.

Az Újtestamentum alapján tanult meg több ezer nyelvet felismerni a mesterséges intelligencia.

Legújabb cikkeinkért kövess minket a Player Google News oldalán is!

Több ezer nyelv létezik a világon, míg különféle dialektusokból mintegy húszezer létezik. A Facebook anyacége, a Meta több mint ezer nyelvet felismerni képes, és azokon kommunikáló MI modellt épített, és ezt nyilvánosan elérhetővé tette. Ez közel tízszeres növekedés az eddigiekhez képest (a Google Translate például 133 nyelven tud), és a vállalat szerint

jelentős előrelépés a kihalásra ítélt nyelvek megmentéséhez.

Nemrég egy észt egyetemen készült fordítómotor 23 finnugor nyelv számára, melyek többsége (pl. livóniai, komi, mansi) először elérhető nyilvános fordítóprogramban.

No de térjünk vissza a Metához, ami a GitHub kódtárhelyen teszi elérhetővé a modelljét. A lépéstől több terület fejlődésnek indulását reméli, kezdve a beszédalkalmazások fejlődésével, a mindenkit megértő üzenetküldésen át a bármilyen nyelven használható virtuálisvalóság rendszerekig.

Egyszeri userként is tudjuk, hogy a jó nyelvi programokhoz hatalmas adatbázis szükséges, ezért „tudnak jobban” a sokak által beszélt nyelveken (angol, spanyol, kínai) a szoftverek. A probléma megkerülése érdekében a Meta kutatói „átképezték” a 2020-as fejlesztésű modelljüket, hogy hang alapon tanulja meg az új nyelveket, nagy mennyiségű címkézett adat szükségessége nélkül.

És honnan vették a forrást? Az Újszövetség hangfelvételeit 1107 nyelven tartalmazó internetes adatbázisból, illetve az Újszövetség hangfelvételeit 3809 nyelven tartalmazó címkézetlen forrásból.

Először javították a beszédhangot és a szöveges adatokat, majd egy algoritmussal a kísérő szöveghez igazították a hangfelvételeket. Ezután megismételték a folyamatot egy másik, az új adatokra tanított algoritmussal. Így további szövegek nélkül meg tudtak tanítani egy új nyelvet.

Ezzel a módszerrel „gyorsan, nagyon-nagyon kevés adatból” építhetnek beszédrendszereket olyan nyelvekből is, amelyeket „mondjuk csak ezren beszélnek”, foglalta össze a projektben részt vevő egyik kutató, Michael Auli. A modell több mint ezer nyelven képes beszélgetni, de több mint négyezret ismer fel.

Másfelől a csapat figyelmeztet, hogy még előfordulnak pontatlanul használt szavak és kifejezések a rendszerben, és azt is elismerik, hogy ez a modell több „elfogult” szóhasználatot tartalmaz más modelleknél, bár „csak 0,7 százalékkal”.

„Vallási szövegek használata MI modellek képzésére ellentmondásos lehet” – mondja az afrikai nyelvek feldolgozásával foglalkozó kutató, Chris Emezue, aki nem vett részt a Meta kutatásában.

(Forrás: MIT Technology Review, fejléckép: Getty Images)

Ez is érdekelhet:

Finnugor nyelvekre specializálta magát egy észt fordítóprogram

Komi, mansi, magyar, finn... fordítómotor készült 23 finnugor nyelv számára, a többségük most először elérhető nyilvános fordítóprogramban.

Ha eddig nem tojtál be az MI-től, most fogsz

Ha valami tényleg félelmetes, az az, amennyit egy év alatt fejlődött a mesterséges intelligencia.

Itt állíthatod be, hogy a Player az elsők között legyen a Google keresőben

Támogatott és ajánlott tartalmaink

Autó-motor

Nem az nyer, aki a leggyorsabb – vezettem a világ egyik legtakarékosabb versenyautóját

roadster.hu

A Leica-kamerás csúcstelefon, ami az utazók legújabb kedvence lesz

Tech

Már több mint ezer nyelvet beszél a mesterséges intelligencia

jelentős előrelépés a kihalásra ítélt nyelvek megmentéséhez.

És honnan vették a forrást? Az Újszövetség hangfelvételeit 1107 nyelven tartalmazó internetes adatbázisból, illetve az Újszövetség hangfelvételeit 3809 nyelven tartalmazó címkézetlen forrásból.

Finnugor nyelvekre specializálta magát egy észt fordítóprogram

Ha eddig nem tojtál be az MI-től, most fogsz

Nem az nyer, aki a leggyorsabb – vezettem a világ egyik legtakarékosabb versenyautóját

A Leica-kamerás csúcstelefon, ami az utazók legújabb kedvence lesz

Sportfotózás mobillal? Ezzel a Leica-kamerás Xiaomi-telefonnal bámulatos képeket lehet lőni

Celine

Rocio

Antonia

Avani

Betsy

Egy európai helyszín kész megmenteni az F1 szétesőben lévő versenynaptárát

Ez volt a legelső fotó az Instagramon

Egy európai helyszín kész megmenteni az F1 szétesőben lévő versenynaptárát

Ez volt a legelső fotó az Instagramon

Foci-vb: A 39 éves Messi lábai előtt hever a világ

Megvan a foci-vb két döntőse – Mutatjuk az ágrajzot és a hátralevő meccseket

Videón, amikor tanítanivaló előzéssel fektették két vállra Alonsót az Eau Rouge-ban

Újabb hagyományt erőszakol meg a FIFA a foci-vb-n

Orbán Viktor a világ legőrültebb streamerének élő adásában kötött ki a vb-elődöntő alatt, és videó is van erről

Mbappé kőkeményen kritizálta a francia válogatottat, miután nem jutottak be a világbajnoki döntőbe

Egyre hosszabb hőhullámok és hevesebb esők alakítják át Magyarország éghajlatát

Lázonganak a szurkolók a foci-vb-n, már most sokan gyűlölik ezt az újítást

3 ok, amiért nem várjuk most ezt a foci vb-t

Ne dőlj be a közösségi média hülyeségeinek: maratont futni egyáltalán nem könnyű