A szoftver és a bit kifejezések születése – avagy John Wilder Tukey filmbe illő története

A mai évfordulón Bódi Zoltán munkatársunk cikkét közöljük.

Ritkán adatik meg, hogy pontosan ismerjük egy új szakkifejezés magalkotóját, elterjesztőjét és a szóalkotás pontos körülményeit. Napjaink legnépszerűbb és leggyorsabban változó tudományterületén, az informatikában pedig egyenesen ritkaságszámba mennek az ehhez hasonló pontos adatok. Ráadásul éppen a legelterjedtebb, legközismertebb két szakkifejezésnek: a bitnek és a szoftvernek ismerjük a születési körülményeit vagy az első írásos megjelenését. A bit és a szoftver terminusok megalkotója és első publikálója John Wilder Tukey amerikai statisztikus, matematikus, kémikus, aki 105 éve, június 16-án született, és 20 éve, július 26-án halt meg.

Tukey tipikus példája azoknak az univerzális természettudományi és matematikai zseniknek, akik kedvelt karakterei a krimiknek, a minden problémát összefüggéseiben látó szupertehetséges filmhősöknek. Életútja és karaktere valóban filmszerű. Tudományos műveltségéből, érdeklődéséből, problémamegoldó képességéből és alkotói időszakából egyenesen következik, hogy miért éppen ez a két, alapvető informatikai szakkifejezés kötődik személyéhez. Egyébként a teljesség kedvéért érdemes megjegyezni, hogy több tucat, alapvetően fontos matematikai, adatelemzési és statisztikai szakkifejezést is megalkotott.

Már kisgyermekként felismerték zsenialitását, és szülei középiskolai tanárok lévén magántanulóként tanították, így alap- és középiskolai tanulmányait a saját ritmusában, otthon végezte el, és jórészt édesanyja tanítványa volt. Kifejezetten nagy hangsúlyt helyeztek szülei arra, hogy John úgy nőjön fel, hogy a tanulást izgalmas, új területeket feltáró, problémamegoldó tevékenységnek ismerje meg. Ez aztán megalapozta egész további életpályáját, gondolkodásmódját. Középiskolás korában, az 1930-as évek legelején már rendszeres látogatója volt a New Bedford-i városi könyvtárnak, ahol rábukkant az Amerikai Matematikai Társaság és az Amerikai Kémiai Társaság folyóirataira (Journal of the American Chemical Society és Transactions of the American Mathematical Society). A számos tudományos cikknek köszönhetően már középiskolás korában egyetemi szintű tudással rendelkezett. Így nem is csoda, hogy egyenes útja volt a Brown Egyetemen a kémiai, majd a Princeton Egyetemen a matematikai tudományos pálya felé. Rendkívül izgalmas és sokoldalú életművének a részletezése helyett csak néhány meghatározó mozzanatot emelek ki, hogy könnyebben megértsük, hogyan és miért alkotta meg és terjesztette el a szakterületéhez kapcsolódó többtucatnyi új szakkifejezést. A Princetonon matematikából doktorált, majd a világháború közeledtével a tüzérségi tevékenységet támogató matematikai és adatelemzési munkát végzett. Ekkor vett ismét fordulatot a pályája, mert egyre jobban kezdte érdekelni a fokozatosan megerősödő, de az 1940-es években még új területnek számító adatelemzés és statisztika tudományterülete. Majd a világháború után a robbanásszerű fejlődésnek induló számítástechnika is azonnal felkeltette az érdeklődését, hisz nagyon hamar felismerte, hogy a hagyományos statisztikai, adatelemző munka módszertanát és hatékonyságát a számítógépek hihetetlen mértékben meg fogják újítani. Tukey is ezek közé az újítók közé tartozott, hisz 1945-től egyetemi katedrája és a kormányzati tudományos tanácsadói munkája mellett tagja lett az AT&T távközlési társaság híres Bell Laboratóriumának, ahol rajta kívül más tudományos óriás is dolgozott, például Claude Elwood Shannon, aki megalkotta a kommunikáció matematikai modelljét, amely máig az egyik meghatározó kommunikációs modell. Tehát Tukey nagy lendülettel fogott neki annak a munkának, hogy miképpen lehet a digitális nagyszámítógépeket gyakorlati feladatok és elméleti tudományos problémák megoldására alkalmazni. Az 1950-es évek Amerikájának tudományos környezetében vagyunk, a modern informatika hajnalán, tele újító erővel, hatalmas gazdasági támogatottsággal, ambiciózus, szupertehetséges fiatalemberek társaságában. Ebben a környezetben Tukey-t fáradhatatlan munkakedve, újító szelleme, elméleti elmélyültsége és gyakorlati problémamegoldó képessége arra vezette, hogy foglalkozzon a modern számítástechnika működésének alapjaival, és így törvényszerű, hogy alapkifejezések definiálása, megalkotása vagy elterjesztése fűződik a nevéhez.

A szoftver kifejezést a mai értelemben elsőként John Tukey írta le egy tanulmányában, az Amerikai Matematikai Társaság American Mathematical Monthly című folyóiratában 1958. január 9-én. Ezt írja: „Manapság a szoftver úgy jellemezhető, hogy ezek a gondosan megtervezett értelmező rutinok, fordítóprogramok és automatizált programozási eljárások legalább annyira fontosak a modern számítógépek esetében, mint a képernyő, a tranzisztorok, a vezetékek, a mágnesszalagok és más ehhez hasonlók hardvere”. A szoftvert tehát Tukey a hardver fogalompárjaként vezette be az informatika világába. Hozzá kell tenni, hogy Tukey előtt szóban már minden bizonnyal használták ezt a kifejezést szakmai körökben, de ebben a jelentésben, így definiálva, nyomtatásban John Tukey írta le először.

A szoftver jelentéssűrítő összetétel, amely a hardverrel együtt az informatikai szaknyelv meghatározó eleme. Egy szóval lefordíthatatlan, összetett jelentésű, értelme nagyjából: ’a számítógépet működtető programok’, egyszerűsítve a program szóalak felel meg legjobban a jelentésének. Az angol összetétel soft előtagjának jelentése ’puha, lágy’, a -ware utótag jelentése ’holmi, anyag, áru’, az informatikában leginkább ’eszköz’. Ez a metaforikus kifejezés a hardver szemléleti és jelentésbeli párja, hiszen míg a hardver a kemény, megfogható fizikai eszközöket – gyakorlatilag magát a számítógépet, illetve annak a fizikai alkotóelemeit – jelenti, addig a szoftver a megfoghatatlan, szellemi eszközöket, leginkább a programokat. A hardver és a szoftver annyira elterjedt a magyar nyelvhasználatban, hogy helyesírásuk követi a kiejtést, és az angolos hardware, software helyett fonetikusan átírjuk őket. A software a hardware-rel az angolban -ware utótagú szócsaládot teremtett. A -ware utótagú szavak jól példázzák az informatikai kifejezések stílusát és keletkezési módját, hisz metaforikus, képi jelentésű kifejezésekből analógiás úton alakult ki egy szócsalád, amely kezdetben szakmai szleng volt, ám mára már széleskörűen használt, elfogadott szakkifejezésekké váltak ezek a szavak. Ezúttal csak néhány példával szemléltetem, hogy John Tukey-nek köszönhetően milyen élő, innovatív szócsalád született a -ware végződésű szavakból: adware ’hirdetőprogram’, malware ’károkozó program’, ’rosszindulatú program’, shareware ’kipróbálható program, amelyet a próbaidőszak után meg lehet vásárolni’, spyware ’kémprogram’, ransomware ’zsarolóprogram’.

A bit szakkifejezés nélkül a mai informatika szintén elképzelhetetlen lenne. A bit mértékegység nevét John Tukey a binary digit, azaz bináris (kettes számrendszerbeli) számjegy angol kifejezés rövidítéseként, szóösszevonással alkotta meg. Az információ alapegységének is szokták nevezni a bitet, értéke 0 vagy 1 lehet. Egyébként a bit mértékegység nevét éppen a fent már említett Claude Elwood Shannon (Tukey Bell laboratóriumbeli munkatársa) terjesztette el a kommunikáció matematikai modelljéről szóló tanulmányában. Egy byte [bájt] alatt általában 8 bitet értünk. (Ez a legelterjedtebb, általánosan használt forma, noha korábban léteztek 6, 7, illetve 9 bitből álló byte-ok is.) A számítástechnikának ezek a mértékegységei közhasználatúak. A mértékegységek írásmódját ugyan külön szabvány határozza meg, de a bit és a byte a szabványhoz képest új mértékegységnek számítanak, így az írásukról nincs központi megállapodás. A helyesírásunk logikájára hagyatkozhatunk csupán: a legtöbb mértékegységünk nevét magyarosan írjuk le: kiló, deka, tonna, de a tulajdonnévi eredetű mértékegységek nevének természetesen megtartjuk az eredeti helyesírását: Celsius, Joule, Ohm, Hertz. A bit helyesírásával nincs probléma, mert az eredeti, angol helyesírás megfelel a kiejtést követő magyar írásmódnak. A byte angol helyesírása viszont eltér a magyartól. A byte esetében helyesírásunk általános logikája, illetve a magyar írásszokás ellentmond egymásnak: míg a helyesírási logika a bájt írást sugallja, az írásszokásban inkább az angolos byte (sőt a nagybetűs Byte) alak terjedt el.

 

Források:

Bódi Zoltán, Infoszótár. Informatikai fogalmak eredete, magyarázata és használata. Tinta Könyvkiadó, Budapest, 2010.

Brillinger, David R., John W. Tukey: His Life and Professional Contributions. The Annuals of Statistics, 2002. Vol. 30, No. 6, 1535–1575. https://www.stat.berkeley.edu/~brill/Papers/life.pdf

Norman, Jeremy, Shannon's „A Mathematical Theory of Communication”. History of Information, http://www.historyofinformation.com/detail.php?id=673

Norman, Jeremy, The Origins of The Term „Software” Within the Context of Computing. History of Information, http://www.historyofinformation.com/detail.php?entryid=936

O'Connor, J. J, Robertson E. F., John Wilder Tukey. 2004, School of Mathematics and Statistics University of St Andrews, Scotland https://mathshistory.st-andrews.ac.uk/Biographies/Tukey/

Shannon, Claude E., A Mathematical Theory of Communication. The Bell System Technical Journal, Vol. 27, July, October, 1948, 379–423, 623–656, http://people.math.harvard.edu/~ctm/home/text/others/shannon/entropy/entropy.pdf

Tukey, John. W., The Teaching of Concrete Mathematics. American Mathematical Monthly, January 9, 1958. https://www.maa.org/sites/default/files/pdf/CUPM/first_40years/1958-65Tukey.pdf

(Kiemelt kép: John Tukey. Forrás: Wikipedia)