Mesterséges intelligencia a szövegalkotásban. Hogyan viszonyuljunk hozzá?

A mesterséges intelligencia pár hónap alatt robbant be a köztudatba és a tudományos diskurzusba egyaránt. Hogy megfelelően tudjuk alkalmazni ezt az eszközt, érdemes nagy vonalakban áttekinteni a működését.

A mesterséges intelligenciák (MI) közül a legismertebb az OpenIA nevű cég által fejlesztett ChatGPT, viszont érdemes tudni, hogy több hasonló és más elven működő MI-rendszer is van, és a tudományos kutatás-fejlesztés már évtizedek óta zajlik ezen a területen.

A ChatGPT nevű rendszer nevéből is kiderül, hogy a párbeszéden alapuló szövegalkotásra fejlesztették ki. Az angol chat szó már közismert, a jelentése ’csevegés’, ’beszélgetés’, viszont a GPT betűszó jelentése nem köztudott: GPT = generative pretrained transformer, azaz ’generatív betanított transzformer’. Ez azt jelenti, hogy a mesterséges intelligenciát alkotó bonyolult algoritmusok hálózata (a neurális háló) a rendszer hátterében álló hatalmas (több százmilliárd szövegszavas) szövegadatbázisból transzformál (’alakít át’) és generál (’hoz létre’) új szövegeket az eszközt használó személy instrukcióinak megfelelően. Ehhez pedig digitális nyelvi modellt használ a rendszer. Ezek nem számítanak újdonságnak, hiszen nyelvi modelleket alkalmaznak például a gépi fordítók, a nyelvhelyesség-ellenőrzők. A ChatGPT kis mennyiségű szöveg beadásával képes nagy mennyiségű, releváns szöveget megalkotni, vagy fordítva: nagy mennyiségű szövegből képes kis mennyiségűt alkotni.

Forrás: https://commons.wikimedia.org/wiki/File:Artificial-Intelligence.jpg

A generatív MI-knek viszont vannak hibái, amelyek alapján fel lehet ismerni az általuk alkotott szövegeket. Ilyen például a szóhasználat viszonylagos kiszámíthatósága, a mondatok szerkezeti sorrendjének nem mindig tudatos alakítása, a mondatszerkezetek viszonylagos egysíkúsága, a stílusváltozatok egyhangúsága. A ChatGPT nem kifejezetten a magyar nyelvre van tervezve, és mivel az internetről veszi a szövegeket, ezért azoknak a minősége sem mindig tökéletes. Márpedig a generatív MI kizárólag olyan minőségű szöveget tud alkotni, amilyen színvonalú szövegek vannak az adatbázisában. Már zajlanak olyan hazai kutatások és fejlesztések, amelyek ellenőrzött magyar szövegadatbázist és jó minőségű magyar nyelvi modellt alkalmaznak. A generatív mesterséges intelligenciák további veszélyforrásai, ha forráskritika nélkül fogadjuk el a szövegeiket.

Valószínű, hogy az MI-rendszerek átvesznek szövegelemzési, összefoglaló, szövegalkotási munkaelemeket az emberektől. Az is tény ma már, hogy több szakmai és tudományterületen működnek olyan speciális mesterséges intelligenciák, amelyek nagy mennyiségű adatok elemzésére vannak tréningezve, például az orvostudományban jellemzően az állóképek (röntgenfelvételek) elemzésére alkalmaznak ilyen eszközöket.

Rendkívül fontos azonban, hogy minden esetben az ember hozza meg a végső döntést. És ez kulcs! Ezek a rendszerek akkor lehetnek barátaink, ha megtaláljuk, hogy pontosan miben tudnak a segítségünkre lenni, és nem az emberi munkát akarjuk velük helyettesíteni, az alkotó folyamatban a végeredményt mindig az embernek kell elbírálnia.

 

Dr. Bódi Zoltán, Magyarságkutató Intézet
a Nyelvtervezési Kutatóközpont tudományos főmunkatársa