2020. évfolyam / 2020/1.

Automatizálható a közérthető megfogalmazás? Jog, számítógépes nyelvészet és pszicholingvisztika találkozása

Kattintson a Fullscreen ikonrafullscressn , ha a folyóiratot nagyobb méretben kívánja olvasni!

 

Bevezetés

Jelen tanulmányban a jogi nyelvvel összefüggésben korábban már megfogalmazott közérthetőségi törekvéseket és azok eredményeit mutatom be egy nagyobb kutatás részeként, melynek célja egy olyan szoftver kifejlesztése, amely (kvázi a helyesírás-ellenőrzők mintájára) automatikus közérthetőségi javaslatokkal támogatja a határozatszerkesztési munkát például a bíróságok jogalkalmazási tevékenysége során.

Ahhoz, hogy egy ilyen segédprogram megvalósítható legyen, pontos meghatározások szükségesek a közérthetőség mibenlétére, a jogi nyelv érintett aspektusaira és a megelőző releváns kutatási eredményekre vonatkozóan. Mivel az angolszász országokban általánosságban a hivatalos dokumentumok érthetőségére vonatkozóan már egészen az 1920-as évektől találunk mérőszámokat és standardokat, így elmondhatjuk, hogy a közérthetőség kérdése is a múlt század hetvenes éveiig nyúlik vissza, a jogi szövegek tanulmányozása pedig már a hatvanas években megkezdődik.[1] Ezenkívül a jogi nyelvet hazánkban is intenzíven kutatják, így a témafelvetés jelentős teoretikus és gyakorlati eredményekre[2] alapozható.

Olvashatósági formulák

Azon törekvések, amelyek szövegek egy csoportjának könnyebb olvashatóságát célozzák, az angolszász nyelvterületen már közel százéves múltra tekintenek tehát vissza (Mesmer 2008). E célra elsőként olvashatósági formulák, illetve olvashatósági pontszámok[3] alkalmazása terjedt el. Ezeknek az 1920-as évektől kezdve több száz többé-kevésbé különböző válfaja lett ismert, és alkalmazásuk elterjedt többek között az újságírásban, a kutatásban, az egészségügyben, a jogban, a biztosítási üzletágban és egyes ipari vállalatok körében is. Reneszánszukat az 1950-es években élték, amikor is az amerikai katonaság kidolgozta saját értékelési rendszerét a műszaki kiképzési anyagokhoz, ezzel talán az első kormányzati szerv volt a tengerentúlon, amely célzott standardot alkalmazott hivatalos szövegek érthetőségének javítására (Dubay 2004: 2).

Az olvashatósági formulák jellemzően mindössze néhány paramétert vesznek figyelembe és ezek alapján egy képlet szerint számított számértékkel jellemzik a bemeneti szöveg olvashatóságát. Az egyik legismertebb, a Flesch–Kincaid olvashatósági formula[4] például főként a mondatonkénti átlagos szószámból és a szöveg szavainak átlagos hosszából állít elő egy 0 és 100 közötti pontszámot, amelyet a tesztet alkalmazók az olvasási nehézséggel korrelálóként ismernek el.[5]

A formulák legnagyobb előnye, hogy könnyen hozzáférhető adatokból állítanak elő egyszerűen értelmezhető adatokat, illetve sok esetben akár egyetlen gombnyomásra elérhetőek akár online felületeken is[6] az értékelendő szöveg egyszerű beillesztése vagy feltöltése után. Éppen ezért alkalmazói kör nem korlátozódik kizárólag statisztikai vagy nyelvészeti ismeretekkel rendelkezőkre, a szöveggel kapcsolatos visszajelzést bárki szinte azonnal elérheti. Népszerűségüket jól jelzi például, hogy egy implementált olvashatósági mérés mindmáig megtalálható a világszerte egyik legnépszerűbb szövegszerkesztő, a MS Word[7] felületén is (Farral 2012).

Nyelvészeti szempontból azonban problémássá pontosan ez a fajta „egyszerűség” teszi ezeket. Az olvashatósági formulák mechanikus mutatókként funkcionálnak csupán, amelyek a szöveg néhány arányszámát veszik csak figyelembe, nem referálnak sem szintaktikai, sem szemantikai összetevőkre. Kritikusaik szerint az olvashatósági formulák mindösszesen néhány felszínes szerkezeti jegyet vesznek tekintetbe, és ebből próbálnak meg következtetéseket levonni azokról az összetett kognitív folyamatokról, amelyek egy szöveg értelmezése közben zajlanak. Ahogyan (éppen a MS Word említett funkciója kapcsán) Anderson és Hart-Davis (2010: 283) megfogalmazza: „A bekezdésenkénti mondatok, mondatonkénti szavak és szavankénti karakterek jelentősége csekély […] Ha azt akarod tudni, nehéz-e megérteni egy dokumentumot, kérd meg a kollégádat, hogy olvassa el.”[8]

Az olvashatósági formulák fejlesztése az elmúlt néhány évtizedben fokozatosan elkezdett távolodni a „klasszikus” irányvonaltól, megindult más tudományterületekről érkező módszerek és elméletek[9] adaptálása is. Ezek közül a jelen tanulmány szempontjából legfontosabb lépés azon (lexikai, szintaktikai és stiláris) jellegzetességek azonosításának kísérlete, amelyek az érthetőséget (negatívan) befolyásolják.

Klare (1976) több mint harminc elérhető tanulmányt hasonlított össze, amelyek az olvashatósági formulák hatásait vizsgálták, és konklúzióként megkísérli azon lexikai és szintaktikai jegyek felsorolását, amelyek véleménye szerint egyes esetekben a pontszámok alapján újraírt szövegek érthetőségének javulását eredményezték. Véleménye szerint a legfontosabb faktorok, amelyek kihatottak a szövegek érthetőségére, a következők voltak:

1. táblázat
Megértést befolyásoló tényezők Klare (1976: 148) szerint

Lexikai jegyek

Szintaktikai jegyek

  • tartalmas / funkció­szavak aránya
  • a tartalmas szavak
    közismertsége, hossza és gyakorisága
  • konkrét / absztrakt
    vonatkozás
  • asszociatív jelleg
  • cselekvő vagy nominalizált igei konstrukció(k)
  • mondathossz (főként tagmondatoké)
  • aktív / passzív mondatszerkesztés
  • affirmatív / negatív mondat
  • beágyazottság jelenléte
  • beágyazottság alacsony / magas foka (többszörös összetételek)

A fenti felsorolás élesen elüt az olvashatósági formulák számításánál korábban használt változóktól, főként a felsorolás azon elemeinek tekintetében, amelyek már implicit módon szemantikai szempontokat is feltételeznek.[10]

Ezt a fajta elmozdulást jól jelzi Felsenfeld és Siegel (1981) leírása, amelyben az akkoriban frissen kialakult Plain Language Movement kapcsán a közérthető törvényhozás aspektusait veszik számba, melyek véleményük szerint:

  • a használni kívánt nyelvi standard kiválasztása,
  • a szükséges kormányzati beavatkozás ennek érvényre juttatásához,
  • valamint a közérthetőséget „kikényszerítő” szabályozás kérdése.

A nyelvi standard szempontjából két eltérő nézőpontot különböztetnek meg, melyek egyike az általuk „objektívként” aposztrofált, olvashatósági formulákat a középpontba helyező közérthetőségi törekvés, melyet főként a korábban már említett matematikai precizitással, viszont ugyanezért felmerülő rugalmatlansággal jellemeznek, másrészről pedig megemlítik az ún. „szubjektív standard”-ot. Az utóbbi által egy közérthető szöveggel szemben támasztott elvárásokat interpretációjuk szerint olyan szavakkal jellemezhetjük, mint a „világos”, „koherens”, „mindennapos”, „gyakori” vagy akár „olvasható”, „az átlagember számára érthető”, „magyarázat nélkül is érthető” vagy „követhető”.[11]

Plain Language Movement

Az elsősorban a hatékony kommunikáció igényével fellépő, mára széles társadalmi bázissal rendelkező Plain Language Movement (a továbbiakban: PLM) kezdete a múlt század hetvenes éveiig vezethető vissza. Az amerikai egyesült államokbeli szimbolikus kezdő dátumaként 1975. január 1-jét szokás említeni (Felsenfeld és Siegel 1981, Asprey 2003), amikor is az akkori First National City Bank (mai nevén Citybank) saját kezdeményezésére hatályba léptette új, közérthetőségi követelményeket is figyelembe vevő fogyasztási hitelekről szóló tájékoztatóját. Ez az önkéntes döntés nagy nyilvánosságot kapott és nagy hatással volt arra, hogy a PLM által képviselt elvek széles körben ismertté váltak (vö. Asprey 2003: 65).

A PLM az általa megfogalmazott elvek alkalmazását ugyan nem korlátozta kizárólag a jogi nyelvre, azok fokozatosan ott is érvényre jutottak. Az egyik legjelentősebb állomás a PLM-törekvések sorában a 2010. október 13-án Barack Obama elnök által aláírt törvény a közérthető megfogalmazásról[12] (Plain Writing Act of 2010).[13]

A törvény egyebek mellett kötelezi a kormányzati ügynökségeket, hogy:

  • minden általuk kiadott vagy felülvizsgált dokumentumban közérthető megfogalmazást használjanak,
  • erre képezzék munkavállalóikat,
  • hozzanak létre adminisztratív folyamatokat a törvény betartásának belső ellenőrzésére,
  • tartsanak fenn a honlapjukon egy külön felületet, amelyen a hozzájuk fordulókat az ügynökség törvénynek való megfeleléséről tájékoztatják,
  • és kapcsolattartó kijelölésére kötelezi őket, aki dedikáltan a közérthetőségi törvénnyel kapcsolatos lakossági visszajelzéseket figyeli és kezeli.

Három későbbi elnöki rendelet[14] szintén megerősíti a közérthetőségi törekvések fontosságát.

Az amerikai kormányzat 2011-ben kiadott egy szövetségi közérthetőségi iránymutatást is (FPLG[15]), amelyben részletesen kifejtik, milyen elvásároknak kell megfelelniük egy közérthető szövegnek.

A dokumentum elvitathatatlan előnye, hogy a kapcsolódó nyelvészeti kutatások explicit hivatkozása (pl.: Garner 2001, Murawski 1999, Charrow, Erhardt és Charrow 2007 stb.) által direkt kapcsolatot teremt a kormányzati kommunikáció és a tudományos szféra eredményei között.

A nyelvi különbégek miatt nem minden fenti eset releváns, vagy szemléltethető megfelelő magyar példával, ugyanakkor a javaslatok többsége (a szükséges átalakítás után) jelentőséggel bírhat a magyar nyelvű jogi szövegek vizsgálata során is.

2. táblázat
Összefoglalás a PLM-irányzatban keletkezett közérthetőségi javaslatokról a FPLG alapján

Lexikai szint

Mondat-szint

Igék esetében:

  • cselekvő igék használata passzív szerkezet helyett
  • egyszerűbb jelentésű igék használata[16]
  • nominalizáció kerülése
  • modalitások jelölése a megfelelő segédigék kitételével
  • összevonások megengedése[17]

Főnevekre, névmásokra vonatkozóan:

  • névmások explicit kitétele; személytelen szerkezetek kerülése[18]
  • rövidítések kiváltása

További javaslatok:

  • funkcióigék kerülése
  • köznyelvben is használatos kifejezések jogi kontextusban történő újradefiniálásának kerülése
  • definiált kifejezések konzisztens használata
  • technikai, jogi és idegen zsargon mellőzése
  • archaizmusok kerülése
  • átlátható tagolás, lehetőség szerint több rövidebb mondat alkalmazása egyetlen többszörösen összetett konstrukció helyett
  • a főbb mondatrészek (A, Á, T) egymás szűk környezetében tartása, ha lehetséges
  • többszörös tagadás, és „kivételek alóli kivételek” kerülése
  • a legfontosabb normatív tartalomnak a mondaton belüli előremozgatása

Nagyobb kontextusra (~bekezdés) vonatkozó ajánlások

A teljes szövegre vonatkozó általános megjegyzések

  • tételmondat alkalmazása
  • átvezető szavak, kötőelemek használata[19]
  • rövid bekezdések; témánkénti szövegtagolás
  • szemléltetés példákkal
  • többtagú felsorolások lehetőség szerint listákba szedése, táblázatok, illusztrációk alkalmazása
  • kereszthivatkozások minimalizálása

A pszicholingvisztikai perspektíva

A pszicholingvisztika eredményeinek, hipotéziseinek és (elsődlegesen kísérleti) módszereinek integrálása a jogi nyelv nyelvészeti kutatásába az 1970-es évekre datálható, az egyik legkorábbi és talán legtöbbet idézett példája Charrow és Charrow (1979) átfogó vizsgálata. A szerzőpáros arra tett kísérletet, hogy a szövegösszefüggések kognitív feldolgozási folyamatai során keletkező nehézségeket azonosítsa és olyan általánosabb lexikai, szintaktikai, szemantikai jelenségeknek feleltesse meg, amelyek ezen feldolgozási nehézségek létét a leginkább magyarázzák és amelyek kiiktatásával a jogi szövegek megértése egyszerűbbé válik.

Vizsgálatuk során esküdteknek szóló tájékoztató szövegeket[20] vetettek alá elemzésnek. Ezek olyan (szándékoltan) joghoz nem értőknek szóló instrukciók, amelyek a bírósági tárgyalás során a döntéshozáshoz nyújtanak segítséget, illetve jogi iránymutatást.

A vizsgálat során az instrukciók szövegeit szegmentumokra bontották, azaz olyan grammatikai vagy szemantikai alapon szervezett konstituensekre, amelyek az előzetes tanulmányok szerint egy egységként dolgozhatók fel.[21] A vizsgálat két fő részből tevődött össze: az első fázisban az eredeti szövegezésű instrukciókat alkalmazták, majd a felkért esküdtek feladata az volt, hogy kétszeri meghallgatás után saját szavaikkal minél több részletet pontosan visszaidézzenek (parafrazáljanak) a hallott szövegrészletből.

Az adatok kiértékelése során a fő kérdések között szerepelt az instrukciók sorrendjének hatása a megértésre, a mondathossz hatása és a résztvevők demográfiai változóinak potenciális korrelációja eredményeikkel.

Az egyik legfontosabb kérdés a felidézett szövegek konceptuális komplexitásához, összetettségéhez kötődik. A parafrázistesztek lefolytatása előtt a szerzők jogi szakembereket (ügyvédeket, bírókat) kértek meg az adott instrukcióban szereplő jogi/normatív tartalom értékelésére. Az értékelést egy 11 fokú skálán kellett elvégezniük, ahol az 1 a legegyszerűbb, a 11 pedig a leginkább absztrakt, nehezen megérthető jogi koncepciók jelenlétét jelentette. A jogi szakértők előzetesen azt a felhívást kapták, hogy az összetettség értékelésénél minden nyelvtani tényezőt hagyjanak figyelmen kívül, kizárólag a jogi gondolat bonyolultságára legyenek figyelemmel.

Ennek motivációjaként a szerzőpáros azt az akkoriban jogászok körében bevett nézőpontot idézte fel, amely szerint a jogi tematikájú szövegekben nem a mondatszerkesztés okozza a megértési nehézséget, hanem az átadni kívánt jogi fogalom (legal concept), emiatt pedig a szövegek lexikai, szintaktikai egyszerűsítése nem hathat ki a megértés fokára.[22]

Az első eredmények felvételét követően a szöveget újrafogalmazták egy közérthetőbb változatra, ügyelve arra, hogy azok jelentése (a hordozott normatív tartalom) ne módosuljon.

3. táblázat
Pszicholingvisztikai szempontú módosítások és mért hatásaik (Charrow és Charrow 1979 alapján)

Felvetett probléma

Megoldási kísérlet

Eredményezett-e szignifikáns javulást?[23]

Lexikai szint

 

  • Vonatkozó névmások, kopulák elhagyása
  • Nominalizáció
  • Visszaillesztés
  • Igésítés (lehetőség szerint)

Nem mért.

Igen (0,05)

Szintaktikai szint

 

  • Passzív mondat-
    szerkesztés
  • Többszörös tagadások, homályos prepozíciós kifejezések
  • Hátravetett, közbevetett tagmondatok
  • Cselekvő igék használata (lehetőség szerint)
  • Helyettesítés affirmatív megfogalma-
    zással, megfelelő prepozíciós kifejezéssel
  • Áthelyezés

Igen (0,01)[24]

Nem

Nem

Teljes szövegre vonatkozó
általános elvek

 

  • Soktagú listák
  • 1-2 elemű listákkal való kiváltás
  • Szöveg-
    szervezési
    változtatások
    a kulcsfogalmak kiemelésével,
    vagy bővebb kontextus biztosításával

Nem

A 3. táblázat a főbb eredményeket szemlélteti. Mivel a kutatásban 35 esküdt vett részt, így az adatok nem reprezentatívak, arra azonban utalnak, hogy nyelvészeti szempontok szerint végzett (nem normatív tartalmi) átalakítások is előnyösen befolyásolhatják a jogi szövegek megértését.

Habár a kontinentális jogrendszerek keretein belüli vizsgálatokra kevesebb példa áll rendelkezésre, azok következtetései nagyban hasonlóak. Neumann (2009) például arra tett kísérletet, hogy német bírósági döntések és az azokat ismertető újságcikkek érthetőségét vesse össze. Az eredmények kiértékeléséhez hasonlóképpen pszicholingvisztikai módszereket (a szövegek feldolgozásához szükséges idő mérése, a megértést ellenőrző kérdések stb.) használt, és az egyik legfontosabb következtetése szerint a megértés elősegítéséhez nem elengedhetetlenül szükséges a jogi szövegek agresszív mértékű átalakítása, elegendő lehet néhány kisebb (nyelvészetileg motivált ponton elvégzett) módosítás is.

Közérthetőség a jogalkotó szemszögéből

Jogi szövegek esetében a legalapvetőbb kritérium, amelyet említeni szokás, a normavilágosság követelménye. Ez lényegében egy olyan érthetőségi feltétel, amely kiköti, hogy a teljes joganyag a jogalkalmazók számára érthető, világos és egyértelmű tartalmat kell, hogy hordozzon. Ahogyan Trócsányi fogalmaz: „A formális jogállamiság egyik alappillére a jogbiztonság. Az Alkotmánybíróság szerint a jogbiztonság megköveteli azt, hogy a jog egésze, egyes részterületei és az egyes jogszabályok világosak, egyértelműek, működésüket tekintve kiszámíthatóak és előreláthatóak legyenek a norma címzettjei számára (normavilágosság elve).” (Trócsányi és Schanda 2014: 33)

A normavilágosságot a közérthető fogalmazástól főként két distinktív elem mentén különíthetjük el: egyrészről előbbi a norma címzettjein elsősorban nem az „átlagembert”, hanem a jogi szakközönséget, a jogalkalmazót érti, másrészt pedig nem limitálja a megértéshez szükséges kognitív befektetés mértékét sem.[25]

4. táblázat
A Stíluskönyvben szereplő javaslatok[26]

Lexikai szint

Szintaktikai szint

Igék esetében:

  • igésítés
  • igeidők egységes használata

Stiláris jellegzetességek:

  • következetes terminológiahasználat, de szóismétlés kerülése
  • az illetve / illetőleg kifejezések lehetőség szerinti kerülése[27]

Többértelmű kötőszavakkal kapcsolatos javaslatok:

  • kirekesztő választás indikálása a vagy – vagy szerkezettel az egyszerű vagy alkalmazása helyett

Helytelen használat:

  • az amennyiben használata ha értelemben
  • a mégpedig túlhasználata
  • az ugyanakkor használata azonban értelemben
  • felé használata -nak/-nek rag helyett[28]
  • a követően használata az után, nyomán névutók helyett
  • a szemben használata ellen értelemben

Funkcióigék / terpeszkedő kifejezések kerülése, pl:

  • panasszal él – panaszt tesz
  • befizetést eszközöl – befizet stb.

Legjellemzőbb kiemelt példák még: helyez, képez, rendelkezik, történő, történt.

Archaizmusok kerülése:

  • pl.: akként, ilyetén
  • többszörös alárendelések, bonyolult mondat-
    szerkezetek kerülése
  • közbeékelések kerülése
  • alany – állítmány – tárgy – határozók sorrend megtartása[29]
  • többszörös birtokos-szerkezet- láncok mellőzése

Habár a közérthetőség elvi kérdése már korábban is megjelent bizonyos területeket szabályzó joganyagokban,[30] az elmúlt időszak legfontosabb előrelépése a Kúria elnöke által 2013. január 17-én a bíróságok szervezetéről és igazságszolgáltatásról szóló 2011. évi CLXI. törvény (Bszi.) 29. § (1) bekezdése alapján a „Határozatszerkesztés” tárgykör vizsgálatára létrehozott joggyakorlat-elemző munkacsoport összefoglaló véleménye.[31]

A lefolytatott vizsgálat nemzetközi előzményeként többek között megnevezi a Strasbourgban 2010-ben elfogadott Bírák Magna Chartáját, valamint a Vilniusi Nyilatkozatot. Míg előbbi 16. pontja szerint, mint idézi: „A bírósági iratokat és a bírósági határozatokat érthető, egyszerű és világos nyelvezettel kell megfogalmazni”, addig utóbbi kiemeli, hogy „Az igazságszolgáltatásnak meg kell tennie a szükséges lépéseket annak érdekében, hogy erősödjön a bíróságokba vetett közbizalom. […] Az ítéletek és más bírósági határozatok világos és érthető nyelvezettel történő megfogalmazása mind elengedhetetlen e cél elérése érdekében.” (vö. Orosz: 2014)

A dokumentum mellékleteként szereplő Stíluskönyv „A nyelvi egyszerűsítés, egységesítés lehetőségei” című fejezete tartalmazza mindazon javaslatokat és ajánlásokat, amelyek a munkacsoport álláspontja szerint megváltoztathatók és megváltoztatandók a kúriai határozatok szövegezésében (4. táblázat).

A munkacsoport véleménye, javaslatai a legfőbb pontokon összeegyeztethetőek a korábban a PLM kapcsán kiemelt nyelvi egyszerűsítési irányelvekkel (2. táblázat), hasonlóan a pszicholingvisztikai perspektívát alapul vevő kutatások során megállapítottakkal (3. táblázat).

A jogi nyelv jellemzői

Az eddigi összevetés kirajzolta azokat az irányokat, amelyekben a jelentősebb nyelvészeti motiváltságú kutatási irányok a közérthető megfogalmazásért felelős jellemzőket keresték. Ahhoz azonban, hogy ezek helyességéről képet alkothassunk, szükséges megvizsgálni azokat a jellemzőket, amelyekkel a jogi szaknyelv valóban rendelkezik a köznyelvvel szemben.

Arra a teoretikus (mégis gyakorlati jelentőségű) kérdésre, hogy milyen is a magyar jogi nyelv, talán a legteljesebb betekintést az OTKA-112172 kutatás során nyelvész, jogász és informatikus szakértők együttműködésével létrejött Miskolc Jogi Korpusz (a továbbiakban: MJK) adja.[32]

A hat szövegosztály szerint szervezett (kódexjog, ítéletek, magyarázó szövegek, fórumok, átiratok és jogszabályok)[33] korpusz beható elemzése statisztikai és korpusznyelvészeti módszerekkel történt. A köznyelvet reprezentáló korpuszként az elemzés a Szeged Treebanket (Vincze et al. 2010) alkalmazta. A szófaji gyakorisági adatok igazolták azon prekoncepciót, mely szerint a jogi szövegekben a főnevek aránya jelentősen magasabb, mint a köznyelvben, a MJK esetében ez az arány összesítetten 26,71%-ot,[34] míg a Szeged Treebank (a továbbiakban SzT) esetében mintegy 19,29%-ot tett ki. Az igék számarányának alakulása ezzel ellentétes: a MJK esetében összesen 7,93%, a SzT-t tekintve pedig 11,88%-os arány figyelhető meg. Ez a két adat összességében tehát a jogi szövegek erősen nominalizált természetére utal. Az összesített szófaji adatok alapján, és a Kendall-együtthatót alapul véve a köznyelvi szövegekhez a jogi fórumok és az ítéletek állnak a legközelebb (Vincze 2018: 12–15).

A függőségi nyelvtani szintaktikai elemzés megmutatta továbbá, hogy a kódexjogi, valamint jogszabályi szövegek viszonylag sok közbevetést tartalmaztak, emellett több alá- és mellérendelő szerkezetet, ami az összetett mondatok magasabb arányára is enged következtetni. Hasonlóképpen Kendall-együtthatóval jellemezve, a köznyelvtől vett legnagyobb távolságot a szintaktikai viszonyok alapján a jogszabályszövegek és a kódexjogi szövegek mutatták (Vincze 2018: 16–20).

A pszicholingvisztikai tényezők közül az 5. táblázat szemlélteti az egyes részkorpuszok tulajdonságait.

5. táblázat
Pszicholingvisztikailag releváns jegyek (I.: kódexjog, II.: ítéletek, III.: metanyelv, IV.: fórumok, V.: átiratok, VI.: jogszabályok, V: minden részkorpuszra érvényes, kiemelés: ahol az adott jellemző gyakorisága nagyobb) forrás: Vincze (2018: 31–33)

Jellemző

Rész-
korpusz

A köznyelvi korpusz (SzK) vonatkozó értékéhez viszonyított arány

Mondathossz (átlagos szószám szerint)

I., II., III.

> SzK

IV., V., VI.

< SzK

Mondathossz (átlagos karakterszám szerint)

IV., V., VI.

< SzK

I., II., III.

> SzK

Átlagos szóhossz

IV., V.

< SzK

I., II., III., VI.

> SzK

Igétlen mondatok

> SzK

Funkciószavak

II., IV., V., VI.

< SzK

I., III.

> SzK

Retrokondicionális[35] szerkezetek

I., II., III.

> SzK

IV., V.

< SzK

Funkcióigék: valamire kerül

> SzK

Az egyes (rész)korpuszok továbbá a Jaccard-távolságot figyelembe véve az alábbiak szerint rendezhetők sorba:

Köznyelv < Átiratok < Fórumok < Jogszabályok < Kódexjog < Ítéletek < Metanyelv (forrás: Vincze 2018: 33, 20. ábra).

A fenti jellemzők, valamint a szövegtípusok (részkorpuszok) Jaccard-távolság szerinti sorba állításából kirajzolódik a kép, mely szerint a jogi domén szövegei nem egységesek, azonban az előzetesen feltételezett nyelvi egyszerűsítésre is módot adó jellemzők valóban strukturálják azokat, és intuitívan alátámasztani látszanak egy egyszerűsítésre konstruált szoftver megtervezhetőségét.

Egy ilyen szoftver alkalmazási területének a jelen adatok alapján főként a bírósági ítéletek területe látszik kézenfekvőnek. Ennek oka főként a norma címzettjeinek köre, amely az adott esetben sokkal közvetlenebbül érinti a joghoz nem értőket, mint bármely más jogi szövegtípus esetén. A kódexjog, jogszabályok szövegei sokkal ellentmondásosabb területet képeznek, tekintettel arra, hogy azokat a jogalkotó elsődlegesen a szakmai közösségnek, a jogalkalmazóknak szánja, habár tartalma mindenki számára megismerhető és érthető kell(ene) hogy legyen.[36]

Összegzés

A jelen tanulmány keretei között számba vettem a szakirodalomban fellelhető, közérthetőséggel kapcsolatos korábbi megfigyeléseket, álláspontokat és fontosabb összegző vizsgálatokat. A közérthetőség mibenlétére elsődlegesen az azt befolyásoló tényezőkön keresztül kerestem választ. A fontosabb, korábbi szakirodalmi munkák alapján releváns nyelvi jellemzők ismertetése után a Miskolc Jogi Korpusz példájának ismertetésén át mutattam be a talált jegyek gyakorlati jelentőségét.

A tanulmány fő következtetése, hogy véleményem szerint a szaknyelvi kritériumok sérülésének veszélye nélkül is tehetők olyan automatikus javaslatok a jogi szövegek egyes csoportjai esetében, amelyek növelhetik azok érthetőségét a joghoz nem értő közönség számára is. Az ezt elősegítő szoftver implementációja több fázisban valósulhat majd meg. Első állomásként pilot jelleggel csak a nyelvtechnológiai eszközök segítségével nagy biztossággal megoldható automatikus javaslatok kerülnek kifejtésre, ezt követően a későbbi fázisokban a szoftver tetszőlegesen bővíthető marad további modulokkal.

Irodalom

Anderson, Ty – Hart-Davis, Guy (2010): Beginning Microsoft Word 2010. Springer.

Asprey, Michele M. (2003): Plain Language for Lawyers. Federation Press.

Britton, Bruce K. – Gülgöz, Sami (1991): Using Kintsch’s computational model to improve instructional text: Effects of repairing inference calls on recall and cognitive structures. Journal of Educational Psychology, Vol. 83 No. 3. 329–345.

Charrow, Robert P. – Charrow, Veda R. (1979): Making Legal Language Understandable: A Psycholinguistic Study of Jury Instructions. Columbia Law Review, Vol. 79. No. 7. 1306–1374.

Charrow, Veda R. – Erhardt, Myra K. – Charrow, Robert P. (2007): Clear & Effective Legal Writing, 4th edition. New York, NY: Aspen Publishers. 173–175.

Connaster, Bradford F. (1999): Last rites for readability formulas in technical communication. Journal of technical writing and communication. Vol. 29. No. 3. 271–287.

Dam, Gregory – Kaufmann, Stefan (2008): Computer assessment of interview data using latent semantic analysis. Behavior Research Methods. Vol. 40. No. 1. 8–20.

Dobos Csilla (2019): Intralingvális fordítás és szaknyelvi terminológia. In: Szoták Szilvia (szerk.): Diszciplínák találkozása: nyelvi közvetítés a XXI. században. Budapest: Országos Fordító és Fordításhitelesítő Iroda Zrt. (OFFI) 186–196.

Dubay, William H. (2004): The Principles of Readability, Costa Mesta: Impact Information.

Engberg, Jan (2013): Legal linguistics as a mutual arena for cooperation. AILA Review Vol. 26. No. 1. 24–41.

Farrall, Melissa Lee (2012): Reading Assessment: Linking Language, Literacy, and Cognition. John Wiley & Sons.

Felsenfeld, Carl – Siegel, Alan (1981): Writing contracts in plain English. St. Paul, Minnesota: West Publishing, Co.

Fry, Edward (2004): Understanding the Readability of Content Area Texts. In: Lapp, Diane – Flood, James – Farnan, Nancy – Erlbaum, Lawrence (eds.): Content Area Reading and Learning: Instructional Strategies, Boston: Allyn and Bacon, 2nd ed.

Garner, Bryan A. (2001): Legal Writing in Plain English. Chicago: University of Chicago Press.

Klare, George R. (1976): A second look at the validity of readability formulas. Journal of Reading Behavior. Vol. 8. No. 2. 129–152.

Kurtán Zsuzsa (2015): A magyar jogi szaknyelv leírásának kutatási programja. In: Szabó Miklós (szerk.): A jog nyelvi dimenziója, Miskolc: Bíbor Kiadó. 189–202.

Maxwell, Martha (1978): Readability: Have we gone too far? Journal of Reading Behavior. Vol. 21. No. 3. 525–530.

Mellinkoff, David (1963): The Language of the Law. Boston: Little, Brown and Co.

Mesmer, Heidi Anne E. (2008): Tools for Matching Readers to Texts: Research-Based Practices. New York: Guilford Press.

Murawski, Thomas A. (1999): Writing Readable Regulations. Durham, NC: Carolina Academic Press.

Neumann, Stella (2009): Improving the Comprehensibility of German Court Decisions. In: Grewendorf, G., Rathert, M. (eds.): Formal Linguistics and Law. Berlin: Mouton de Gruyter. 55–80.

Orosz Árpád (2014): A „határozatszerkesztés” vizsgálatának tárgykörében felállított joggyakorlat-elemző csoport összefoglaló véleménye. Glossa Iuridica 1. évf. 2. sz. 165–180.

Szabó Miklós: A jogi nyelv határozatlansága – a jog nyelvi határozatlansága. In: Klaudy Kinga – Dobos Csilla (szerk.): A világ nyelvei, a nyelvek világa. Miskolc: MANYE – Miskolci Egyetem. 134–138.

Thorndike, Edward (1921): The teacher’s word book. New York: Teachers College, Columbia University.

Trócsányi László – Schanda Balázs (szerk.) (2014): Bevezetés az alkotmányjogba. Budapest: HVG-ORAC.

Üveges István (2019): Közérthetőség a jogi nyelvben. Követelmény és/vagy kultúra? Magyar Jogi Nyelv 3. évf. 2. sz. 20–26.

Vincze Veronika (2018): A Miskolc Jogi Korpusz nyelvi jellemzői. In: Szabó Miklós – Vinnai Edina (szerk.): A törvény szavai. Miskolc: Bíbor Kiadó. 9–36.

Vincze Veronika – Szauter Dóra – Almási Attila – Móra György – Alexin Zoltán – Csirik János (2010): Hungarian Dependency Treebank. In: Proceedings of LREC 2010, Valletta, Malta, ELRA.

Vinnai Edina (2010): A jogi nyelv nyelvészeti megközelítése. Publicationes Universitatis Miskolcinensis Series Juridica et Politica. 28. évf. 1. sz. 145–171.

Vinnai Edina (2014): A magyar jogi nyelv kutatása. Glossa Iuridica 1. évf. 1. sz. 29–48.

Vinnai Edina (2015): Jog és nyelv – nyelv és jog. In: Fekete Balázs – Fleck Zoltán (szerk.): Tanulmányok a kortárs jogelméletről. Budapest: ELTE Eötvös Kiadó. 65–114.

Üveges István
PhD-hallgató,
Szegedi Tudományegyetem Nyelvtudományi Doktori Iskola

 


[1] Az első jelentős munkaként a jogi nyelv nyelvészeti kiindulású vizsgálatában például Mellinkoff (1963) munkáját szokás említeni, az olvashatósági formulák első jelentős alapjaként Thorndike (1921) vált ismertté, a közérthetőség első átfogó pszicholingvisztikai szempontú elemzéseként pedig Charrow és Charrow (1979) vonult be a köztudatba.

[2] A témában nagyjából 2000 óta folyamatosan jelennek meg újabb eredmények, a teljesség igénye nélkül például Vinnai (2010, 2014, 2015) Szabó (2006), Kurtán (2015) és Dobos (2019).

[3] Eredetileg: readability formulas and readability scores.

[4] Flesch–Kincaid Reading Ease Test: 206.835 – 1015 x (szavak összesített száma/mondatok száma) – 84,6 × (szótagok összesített száma/szavak összesített száma). A végeredmény minden esetben egy 0 és 100 közötti szám, ahol a konstansok biztosítják, hogy a törttel való szorzás után az eredmény ne eshessen ezen a tartományon kívülre, a többi érték pedig a dokumentumtól függő jellemző – ezek állítják be az érték nagyságrendjét a 100 fokozatú skálán.

[5] Az olvashatósági tesztek validitását számos kritika érte, sok esetben például túlzott egyszerűségük miatt, pl.: Maxwell (1978), Connaster (1999). Helyes használatuk szintén gyakran vita tárgya, Fry (2004) például határozottan felhívja a figyelmet arra a jelenségre, mely szerint, mivel az olvashatósági mutatók limitált paraméter alapján állítanak predikciókat, ha kizárólag ezek alapján strukturálunk újra egy szöveget, az adott esetben hatástalannak bizonyulhat, vagy a kiindulásinál is komplexebb szövegtestet eredményezhet, miközben a mutató számszerűen javul.

[6] Pl.: https://www.webfx.com/tools/read-able/ (A link ellenőrizve: 2020.01.04.)

[7] Az értékelést a szövegszerkesztő a már említett Flesch–Kincaid egyszerű olvashatósági formula, valamint a Flesch–Kincaid Grade Test alapján végzi, mely utóbbi a szöveg egyszerű megértéséhez szükséges iskolai végzettség szintjét hivatott megbecsülni. A teszt eredménye az USA-beli iskolarendszer keretei között értendő.

[8] A szerző fordítása.

[9] Britton–Gülgöz (1991) például arra tesz kísérletet, hogy szemantikai alapokat is figyelembe vegyen a mondatok érthetőségének vizsgálatakor. A megoldás alapköve a mondatokon belül szereplő propozíciók (és megfelelő tematikus szerepű kifejezések) azonosítása után átfedések keresése az egymást lineárisan követő mondatok esetében. Amennyiben valamely propozíció, vagy legalább valamely argumentum átfed az egyes mondatok között, akkor feltételezhető, hogy a szöveg kohéziója erős, ezáltal könnyítve a mentális feldolgozást, megadva a megfelelő átvezetéseket az egyes mondatok között.
Dam–Kaufman (2008) számítógépes nyelvészeti eszközöket is bevonva a jelentés egy eltérő ábrázolásához fordult, amennyiben az előforduló szavak kollokációs viselkedését kódolták egy n-dimenziós vektortérben. Az egyes szavak előforduló környezetei jelentették a vektorokat, a környezetek összessége pedig a jelentésre visszautaló faktorként került értelmezésre. Véleményük szerint a megfelelő korpuszon betanított szoftver segítségével az ilyen reprezentációban jelen levő adatokból mélyebb szemantikai ismeretek nyerhetők ki az egyszerű propozíciós átfedésekkel megragadhatónál.

[10] Ilyen például a lexikai szinthez sorolt absztrakt vonatkozású, vagy éppen asszociatívként megjelölt lexikális elemek, vagy a szintaktikai szinten a tagadó mondatszerkezetekkel kapcsolatos megfigyelés, mely szerint azok értelmezése nehezebb kognitív feladat (különösen, ha egymásba ágyazott tagadásokról van szó, mint például az „a gépek meg nem építetlensége” szerkezet esetében, ahol önálló tagadószó, és szuffixum is kifejez negációt).

[11] Innen eredeztetik a szubjektív standard elnevezést is, hiszen szemben az olvashatósági formulák explicit jelzőszámaival, a pusztán elveket kifejező szavakkal fémjelzett elvárások (mint pl.: „könnyen érthető”) erősen feltételezik olyan körülmények figyelembevételét, mint az átlagos olvasó szubjektív viszonyulása a hivatalos szövegekhez, vagy éppen az ideális nyelvhasználóhoz való viszonyítás szükségességét, ezáltal szubjektivizálva azt az absztrakt tartalmat, melyen egy szöveg érthetőségét értjük.

[12] A szerző fordítása.

[13] H.R. 946; Pub.L. 111–274, a törvény teljes szövege elérhető az alábbi linken: https://www.fda.gov/about-fda/plain-writing-its-law/plain-writing-act-2010 (Ellenőrizve: 2020. 01. 06.)

[14] E.O. 12866, E.O. 12988, valamint E.O. 13563

[15] Federal Plain Language Guidelines, US Government, March 2011.

[16] Például az eleget tesz az X szerinti feltételeknek alak helyett az X alapján alkalmazható típusú szerkezetek előtérbe helyezése.

[17] Pl.: don’t használata a do not helyett a természetesebb, a beszélt nyelvhez közelebbi összhatás elérése érdekében.

[18] Főként olyan esetekben, ahol a cselekvés elvárt végrehajtója nem kormányzati szerv, hanem a hozzá forduló ügyfél, pl.: az adóvissza­térítéssel kapcsolatos dokumentumok másolatai benyújtandók, de: az adóvisszatérítéssel kapcsolatos dokumentumok másolatait Önnek be kell nyújtania.

[19] Ezért, vagyis, ezzel ellentétben stb.

[20] BAJI: Book of Approved Jury Instructions in: California Jury Instructions – Civil – Book of Approved Jury Instructions (5th ed. 1969).

[21] A felbontás során a fő szempont a fellelhető minimális predikátum-argumentum szerkezetek egy szegmentumként való kezelése volt, felsorolások esetében pedig minden egyes tag önálló szegmentumnak számított.

[22] A kísérlet végső eredményei ezzel éppen ellentétes eredményt hoztak: azon instrukciók esetében, amelyeket a jogászok konceptuálisan összetettként értékeltek, szignifikáns javulás volt tapasztalható az átfogalmazás után. A szerzők ezzel kapcsolatban felvetik, hogy kérdéses, mennyire választották külön az értékelést végző szakemberek a nyelvi nehezítő faktorokat, valamint a normatív tartalom összetettségét (Charrow és Charrow 1979 1334–35).

[23] Zárójelben az eredeti kísérletben mért szignifikanciaszintek.

[24] Alárendelt tagmondatok estében. A főmondatokat tekintve az eredmények nem voltak szignifikánsak.

[25] A jogi nyelvvel szemben támasztott, több szinten jelentkező érthetőségi elvárás szoros kapcsolatban van annak szaknyelvi státuszával. Az „érthetőség” mint elv szükségszerűen mást fog jelenteni, ha a szakma képviselői a szaknyelvvel szemben fogalmazzák meg, és ha egy eljárás során egy laikus egy neki szóló tájékoztatóval szemben veti fel azt (vö. Üveges 2019: 22–23).
A normavilágosság fontosságát többek között megemlíti a 9/1992. (I. 30.) Alkotmánybírósági (AB) határozat, valamint a 11/1992. (III. 5.) AB határozat is. Utóbbi megfogalmazása szerint „…a jogbiztonság megköveteli a jogszabályok olyan világos és egyértelmű fogalmazását, hogy mindenki, akit érint, tisztában lehessen a jogi helyzettel, ahhoz igazíthassa döntését és magatartását, s számolni tudjon a jogkövetkezményekkel. Ideértendő az is, hogy ki lehessen számítani a jogszabály szerint eljáró más jogalanyok és állami szervek magatartását.”

[26] A felsorolás nem teljes; nem tartalmazza azokat a javaslatokat (például a „dátumok egységes helyesírását”), amelyek sokkal inkább helyesírási, mintsem közérthetőségi kérdésként kezelhetők.

[27] Az indoklás szerint jogi környezetben szerepelhet a pontosabban szólva, helyesebben, valamint és, továbbá alkalmanként még vagy értelemben is.

[28] Pl.: felperes felé – felperesnek jelentésben.

[29] A dokumentum különösen kerülendőként említi az állítmánynak a mondat végére sorolását.

[30] Jó példa erre az egészségügy, ahol a betegtájékoztatók szövegezésével kapcsolatban például a 30/2005. (VIII. 2.) EüM rendelet 3. § (4) bekezdésének szövegezésében találunk elvi megkötéseket a következők szerint: „A betegtájékoztató véglegezése céljából a gyógyszer indikációja szerinti betegek célcsoportjaival konzultációt kell lefolytatni annak érdekében, hogy a betegtájékoztató jól olvasható, egyértelmű és könnyen értelmezhető legyen. Ennek eredményét a betegtájékoztató szövegének tükröznie kell.”
Az egészségügy területén hasonló uniós szabályozások még például:
European Commission: Guideline on the readability of the labeling and package leaflet of medicinal products for human use. Revision 1, 12 January 2009. ENTR/F/2/SF/jr (2009)D/869, valamint
CMDh: Consultation with target patient groups – meeting the requirements of article 59(3) without the need for a full test – recommendations for bridging. Revision 1, April 2009. CMDh/100/2007.

[31] 2013.EI.II.JGY.1.1-2.

[32] A korpusz létrejötte nem volt előzmény nélküli, a jogi nyelv tudományos vizsgálatát hazánkban már egészen az ezredfordulótól számos kutatási program vizsgálta (Nyelvhasználat a jogi eljárásban. Nyelvi átfordítás és ténykonstitúció a jogi tényállás megállapításának folyamatában, valamint A tisztességes eljárás nyelvi aspektusai. A jogi nyelv hatása a joghoz való hozzáférés érvényesülésére).

[33] I. Kódexjog: 1952. évi III. törvény a polgári perrendtartásról; 1998. évi XIX. törvény a büntetőeljárásról; 2004. évi CXL. törvény a közigazgatási hatósági eljárás és szolgáltatás általános szabályairól; 2012. évi C. törvény a Büntető Törvénykönyvről; 2013. évi V. törvény a Polgári Törvénykönyvről teljes szövege, II. bírósági és törvényszéki ítéletek szövegei, III. metanyelvi / magyarázó szövegek; jogszabályok miniszteri indoklásai és jogi egyetemeken használt tankönyvek szövegei, IV. jogi fórumok szövegei, V. bírósági tárgyalásokon és rendőrségi kihallgatásokon készített átiratok (beszélt nyelvi szövegtest), továbbá VI. Jogszabályok: egyéb jogszabályok szövegrészletei.

[34] Részkorpuszok szerinti felosztásban: Fórumok: 20,84%, Ítéletek: 28,56%, Kódexjog: 30,19%, Jogszabályok: 28,82%, Metanyelvi szövegek: 28,70%, Átiratok: 16,08%.

[35] Fordított kondicionális szerkezet, amely esetében a következmény megelőzi a feltételt; a ha akkor fordítottja.

[36] A téma ellentmondásos kettősségéről lásd bővebben: Üveges (2019: 24–25).