Felismerve a mesterséges intelligencia átütő erejét, az OTP Bank a 2021-ben elfogadott Digitális Stratégiájával összhangban, és az állammal közösen, belekezdett a GPT-3 szintű nyelvi modellnek megfelelő, magyar nyelvi modell kialakításába. Az OTP Bank célja, hogy a kutatás-fejlesztési projekt során az állammal, az egyetemekkel, a felhasználókkal közösen építse ki azokat a képességeket, amelyek egy ilyen, az életünket sok szempontból megváltoztató jelenséget kezelni tudnak. Arról, hogy kikkel és hogyan készül az OTP Bank GPT modellje, Kaszás Zoltánt és Schin Lotárt, az OTP Bank szakembereit kérdeztük.
A magyar nyelvi modell létrehozásának fontosságát már a ChatGPT megjelenése előtt felismerve, 2021 decemberében indította el kutatás-fejlesztési projektjét az OTP Bank a magyar állammal és az infrastruktúrát, az angol nyelvi korpuszt és a kapcsolódó tudást biztosító SambaNova Systemsszel együttműködésben. A ChatGPT 2022-es megjelenése és gyors elterjedése beemelte a köztudatba a mesterséges intelligencia hétköznapi használatának lehetőségét.
A GPT-3 szintű mesterséges intelligencia modell (MI) alkalmazásával történő „saját” nyelvi modell építése régiós szinten is egyedülálló. A projekt összköltsége több mint 7 milliárd forint, amelynek kétharmadát az OTP Bank, míg egyharmadát az állam állja.
Miért van szükség magyar modellre?
„A magyar nyelvi modell létrehozásának több motivációja volt: a versenyképesség, a hatékonyságnövelés, a munkáltatói márkaépítés az egyik rész, míg a másik komoly hajtóerő, hogy mélyebben megértsük ezeknek a modelleknek a működését, és az ebből fakadó felelősséget – kezdi Kaszás Zoltán, az OTP Bank csoportszintű digitális ügyvezető igazgatója. „A mesterséges intelligencia transzformatív technológia, így az exponenciálisan növekvő adatvagyonból ezzel a megoldással lehet a leghatékonyabban információt kinyerni és azt értelmezni. Viszont mi nem egy technológia mellett tettük le a voksunkat, hanem amellett, hogy képességeket építsünk. Csak ezáltal érhető el, hogy igazán jól gazdálkodjunk az adatvagyonnal, ahogy az is, hogy fenntartsuk az adatszuveneritást. Ha megkérdezed a ChatGPT-t, hogy ki volt a legutóbbi foci VB nyertese, azt fogja mondani, hogy Franciaország, annak ellenére, hogy Argentína nyerte a tornát. Ez azért van, mert nincs napi szinten frissítve. Ellenben egy „saját” nyelvi rendszernél megvan annak a lehetősége, hogy kontrolláljuk az adatvagyont, ezáltal a tanítást és a modell működési sajátosságait és frissítési intervallumát. Azt gondolom, ez rendkívül fontos szuveneritási és egyben versenyképességi kérdés” – folytatta Kaszás Zoltán.
A motivációk tekintetében az OTP Bank mesterséges intelligencia területének vezetője, Schin Lotár hozzátette: „a magyar nyelvi modell építése és a GPT technológiával foglalkozás oka, hogy a jövő elvárásainak tekintetében is hatékonyak és szerethetőek legyenek a szolgáltatásaink, amelyekkel a belső és külső ügyfeleinket egyaránt ki tudjuk szolgálni.”
Mi történik, ha magyarul tanul az MI?
A versenyképesség-növelésen és azon túl, hogy ne csak egy forrásból lehessen hozzájutni a GPT-szerű nyelvi modellekhez, az is fontos, hogy a magyar nyelv kerüljön fókuszba a fejlesztés során. Elvégre vannak olyan nagy nyelvek, amelyekre természetes módon fókuszálnak a nagyvállalatok, ezzel szemben vannak olyanok, amelyek kisebb figyelmet kapnak, annak ellenére, hogy gazdaságilag, kereskedelmileg fontos szereplőkhöz tartoznak.
„Az OTP Bank 12 országban van jelen, és ezek közül egyik ország anyanyelve sem olyan, amely különösebb figyelmet kapna a nyelvi modellek fejlesztése során. Ezért igyekszünk kihasználni azt, hogy van kapacitásunk arra, hogy ezen változtassunk és tegyünk valamit annak érdekében, hogy több nyelvi anyag álljon rendelkezésre a kis corpusszal rendelkező nyelveken, és ezáltal jobb minőségű modellek váljanak elérhetővé” – tette hozzá Schin Lotár.
Szorosan idetartozik az is, hogy a modellek annyira jók, amennyire a beléjük töltött adat. Az OTP Banknál azt szeretnék, ha erre lenne ráhatásuk, tehát nagyobb transzparenciát, átláthatóságot igyekeznek teremteni. „Azt nem látjuk, hogy bizonyos nyelvi modelleket mivel tanítottak, a ráépült alkalmazás pontosan miként működik, így nem tudhatjuk, hogy egyes helyzetekben jól vagy rosszul reagálnak-e, hiszen nem látunk rá az alapokra. Mi efelett szeretnénk nagyobb kontrollt, ezért nagy hangsúlyt fektetünk az adatokra és a tesztelésre is” – tette hozzá Schin Lotár.
Hogyan válhat mindenki a projekt részesévé?
Ami az együttműködést illeti, az OTP Bank az ELTE részéről a Digitális Örökség Nemzeti Laboratóriummal (DH-LAB) kooperál, akik abban nyújtanak támogatást, hogy a 2019-ben elkészült Webcorpus 2.0 adatmennyiségéhez képest még több álljon rendelkezésre, ami rendszeres frissítésre is kerüljön. Ezenkívül a felsőoktatási szegmensből a Szegedi Tudományegyetem vesz részt a projektben, ahol a fő kutatási és fejlesztési irányvonal, hogy miként lehet a már létező tesztkeretrendszereket a magyar és a régió nyelveire átültetni.
„A mesterséges intelligenciát 2021-ben egy, az életünket megváltoztató technológiaként és egyben lehetőségként azonosítottuk, ami gyorsan meg fog érkezni, éppen ezért a technológia hozta újdonságok megértését, megismerését és elsajátítását helyeztük a fókuszba. Így a kutatás-fejlesztési projekt a munkatársainknak lehetőséget biztosít arra, hogy közben jövőálló képességek birtokosaivá váljanak. Emellett fontosnak tartjuk azt is, hogy az emberek, a felhasználók is értsék és ismerjék a nyelvi modellek, valamint az azt hajtó MI működését” – zárta Kaszás Zoltán.
Az elkészült modellt az OTP Bank a magyar államon keresztül fogja elérhetővé tenni bárki számára.
Mi is az a nyelvi modell?
A nyelvi modell egy olyan számítógépes algoritmus vagy rendszer, amely a természetes nyelvvel (például az emberi beszéddel vagy írással) foglalkozik. Célja, hogy megértse, generálja vagy feldolgozza a nyelvi adatokat. A nyelvi modellek képesek megtanulni a nyelvi mintákat, a szókapcsolatokat és a nyelvtani szabályokat a nagy mennyiségű korpuszok (szöveges adatbázisok) elemzése alapján.
Az újabb fejlesztések, például a GPT-3.5 architektúra által nyújtott nyelvi modellek rendkívül nagy méretűek és bonyolultak, és számos nyelvi feladatot képesek ellátni. Ezek közé tartozik a szöveggenerálás, a fordítás, a kérdések és válaszok kezelése, a nyelvi értelmezés, a chatbotok és a gépi tanulás.
A nyelvi modellek a korábbi nyelvfeldolgozási technológiákhoz képest nagyobb pontosságot és rugalmasságot kínálnak a nyelvi adatok kezelésében. Az ilyen modellalapú rendszerek előrejelzéseket tudnak tenni a következő szóra vagy mondatra vonatkozóan, és olyan nyelvi kontextust biztosítanak, amely segít a szöveg értelmezésében és megfelelő válaszok vagy kimenetek generálásában.