Kell-e nekünk magyar fejlesztésű mesterséges intelligencia?

Az utóbbi két év egyik leggyakrabban emlegetett kifejezése a mesterséges intelligencia, mert a Chat GPT nevű rendszer 2022 novemberének végén került nyilvánosságra, és innentől kezdhette el használni a nagyközönség. 

Innentől kezdve megszaporodtak a különböző mesterségesintelligencia-szolgáltatások, amelyek lassan behálózzák a hétköznapjainkat, és az is tud róluk valamit, aki sosem használta még. Megosztó jelenség: vannak, akik rendszeresen használják és kedvelik, és vannak olyanok is, akik nem szeretik, veszélyesnek találják és elhatárolódnak tőle. Az viszont tény, hogy együtt kell élnünk a mesterséges intelligenciával, és minél többet tudunk meg a működéséről, a használati módjairól, annál kevesebb lesz az előítélet, a sztereotípia és a megalapozatlan félelem.

Ezúttal a rendszer működésének rövid bemutatása után arra a kérdésre keressük a választ, hogy kell-e nekünk saját fejlesztésű, magyar mesterséges intelligencia a globálisan elterjedt és világszerte népszerű, hatalmas tőkével és fejlesztési bázissal rendelkező rendszerek mellett.

A mesterséges intelligencia (gyakran helyettesítjük rövidítve az MI betűszóval) olyan mesterséges gépi tanulási rendszer, amelynek hátterében egy hatalmas, több száz milliárd szövegszóból álló nyelvi adatbázis és egy bonyolult, vektoriális jelentésösszefüggések, dimenziók rendszeréből álló, úgy nevezett neurális háló áll.

A nagy nyelvi adatbázis a benne szereplő nyelvi elemekkel és a rájuk vonatkozó leírással, kapcsolódási szabályokkal modellezi a nyelvek működését, ezért nagy nyelvi modellnek (angolul large language modellnek, rövidítve LLM-nek) nevezik. Az LLM-nek köszönhetően képes a mesterséges intelligencia értelmes, helyes nyelvi tartalmakat generálni.

A neurális háló pedig egy metaforikus kifejezés, az agy neuronhálózatának bonyolult rendszerére utal. Ugyanis a neurális háló összefüggések, jelentéselemek, dimenziók kapcsolati hálójának programozott rendszere. A nagy nyelvi modell és a neurális háló segítségével képes a mesterséges intelligencia rendszere a felhasználói utasításoknak legjobban megfelelő tartalmat generálni.

Anélkül, hogy még jobban belemennénk a működésének a részleteibe, annyit jegyezzünk meg, hogy az MI-rendszerek által generált tartalom, például egy szöveg minősége, helyessége, pontossága sok tényezőtől függ, és ezek között van a tanításukra, fejlesztésükre használt szövegek tartalma, összetétele, minősége. Ha például az interneten általánosan hozzáférhető, változatos tematikájú és műfajú, bármely nyelvű, helyi kultúrától független, válogatás nélküli, jó és rossz, pontos és pontatlan szövegeket egyaránt alkalmaznak a rendszer tanítására, fejlesztésére, akkor az MI által megalkotott szövegek is ilyen változatos minőségűek lesznek. És ne feledjük azt sem, hogy az MI nem ember, tehát nem érti a saját maga által alkotott szövegeket, ezért nem is képes a pontosságukat, hitelességüket, igazságtartalmukat, kulturális elvárásoknak való megfelelésüket ellenőrizni.

Ha nemzeti kultúrával összefüggő, speciális tartalmakkal kapcsolatos feladatokat kell végrehajtania a mesterséges intelligencia rendszereinek, akkor pontosabb, jobb minőségű eredményt kapunk, ha az MI további fejlesztésére válogatott, jól kidolgozott, a nemzeti kultúrát jól reprezentáló szövegeket használunk.

Továbbá a szerzői jogi kérdés és a nemzeti tudomány függetlenségének szempontja is felmerül. A mesterséges intelligencia továbbfejlesztésére alkalmazhatják a felhasználók által megadott szövegeket, tartalmakat személyes adatoktól megtisztított, anonimizált formában. Ez a lehetőség ugyan az MI-alkalmazásokban többnyire korlátozható, de ennek ellenére nem mindegy, hogy egy felhasználó által megadott szöveg külföldi vagy hazai kézbe kerül.

A nemzeti kultúrához igazított, jó minőségű adatokkal, tartalmakkal, hazai erőforrásokkal továbbfejlesztett, hazai mesterségesintelligencia-alkalmazások legnagyobb előnye, hogy a fejlesztésük nemzeti hatáskörben van, ezért növelik a fejlesztő ország tudományos függetlenségét. Nem globális informatikai cégek fejlesztési stratégiájának van kiszolgáltatva a nemzeti tudomány és a hazai felhasználói közösség, hanem olyan MI-rendszert fejleszthetünk, amely a saját nemzeti és tudományos érdekeinknek jól megfelel, és pontos, helyes, a hazai elvárásoknak megfelelő adatokat produkál.

Jó hír, hogy hazánkban is zajlik a mesterséges intelligencia fejlesztése. Ezek közül a HunRen Nyelvtudományi Kutatóközpontjának a PULI névre keresztelt rendszerét emelem ki (https://puli.nytud.hu/). Ezt a mesterséges intelligenciát kifejezetten magyar, ellenőrzött szövegekkel fejlesztik, úgy finomhangolják, hogy a hazai kultúrához jól illeszkedő tartalmakat alkosson.

A címbeli kérdésre tehát elég egyértelmű a válasz: igen, szükség van olyan mesterséges intelligenciára, amelyet hazai erőforrásból, hazai tartalmakkal, hazai kulturális igényeknek megfelelően fejlesztenek. Ez hozzájárulhat a magyar digitális kultúra színvonalának emeléséhez.

Dr. Bódi Zoltán, Magyarságkutató Intézet
a Nyelvtervezési Kutatóközpont tudományos főmunkatársa