A morfológiai elemző és szóalak-generáló felület használata


Virtuális billentyűzet

A párbeszédablak alján található virtuális billentyűzet ikonra kattintva megjelenik egy virtuális billentyűzet. Amennyiben a kurzor az ablakban van, ez a billentyűzet használható mind a valós billentyűzetről, mind a képernyőről, az egér bal gombjával a megfelelő karakterre kattintva.

Ily módon a szövegablakba az adott nyelv fonémáinak jelölésére használt speciális karakterek gépelhetők be anélkül, hogy bármilyen speciális billentyűzetmeghajtó programot telepíteni kellene a gépre.

Különleges karakterek

A kiválasztott nyelvhez tartozó különleges karakterek akkor jelennek meg a virtuális billentyűzeten, ha a képernyőn levő billentyűzeten a bal egérgombbal a jobb oldali Alt billentyűre kattintunk, vagy a valós billentyűzeten lenyomjuk a jobb oldali Alt (AltGr) billentyűt, vagy az Alt és a Ctrl billentyűket együtt. Ekkor akár a valós billentyűzeten, akár a képernyőn levő billentyűzeten lenyomva a megfelelő billentyűt, a különleges karakter jelenik meg és a virtuális billentyűzet visszaáll az alapállapotba.

Üzemmódválasztás

Az elemzés, illetve generálás üzemmódot az egér bal gombjával a megfelelő választógombra kattintva állíthatjuk be a beíró szövegmező felett.

Nyelv- és formátumválasztás

Az elemzendő szöveg nyelvének, valamint a bemenő szövegben és a generált elemzésekben használt karakterek formátumának kiválasztására legördülődobozok szolgálnak.

A nganaszan nyelv esetében az egyes fonémák jelölésére használható karakterek, és választható beállítások leírása itt található.

Elemzés

A szövegmezőbe írt uráli (jelenleg csupán nganaszan) nyelvű szöveget a szövegmező alatti jobb alsó gomb megnyomásával elemeztethetjük meg.

...

A szöveg elemzése a beíró szövegmező alatt jelenik meg. A begépelt szöveg soraihoz több soros (interlináris) formátumban jelenik meg az elemzés.

Az első sort (szürke) az eredeti szövegszavak alkotják.

A második sor az uráli nyelvű szó morfémákra bontását (morfológiai elemzését) tartalmazza, a + a morfémahatár. Minden egyes morféma lexikai alakját a hozzá tartozó kategóriacímke követi.

A harmadik sorban a szó tövének magyar fordítása, és a kapcsolódó toldalékok morfoszintaktikai címkéinek sora látható (itt már a toldalékmorfémák lexikai alakjának megadása nélkül).

Szürke színnel jelennek meg az eredeti szövegszavak.

Fekete színnel jelenik meg az elemzés, ha csak egy lehetséges elemzése van a szónak.

Kék színnel azoknak a szavaknak az (egyik) elemzése jelenik meg, amelyeknek több lehetséges elemzése van. Ilyenkor csak az első elemzést írja ki a program.

A többi lehetséges elemzés akkor jelenik meg, ha az egérmutatóval a kék elemzésre állunk.

A felbukkanó listából kiválasztható az adott kontextusban helyes elemzés, melyre a bal egérgombra kattintva, az zölddel jelenik meg a program által eredetileg javasolt kék elemzés helyén. A zöld színű elemzések helyett is ugyanezzel a módszerrel másikat választhatunk. Ily módon a program egyértelműsítésre is használható.

Szürke #### karaktersor jelenik meg az elemzés helyén ha az elemző szerint a szónak nincs lehetséges elemzése az adott nyelven.

Narancssárga eredményt ad a program, ha a beírt szó helyesen nem elemezhető meg, de a fonológiai szabályok figyelmen kívül hagyásával az elemző lexikonában szereplő morfémák allomorfjainak helyes sorrendben való összekapcsolásával létrehozható az adott karaktersor. Az elemzés ilyenkor mindig a [???] szekvenciára végződik, és a számítógépes morfológiában implementált nyelvtan szerint az adott morfémasornak megfelelő helyes szóalak, vagy alakok a következő sorban (az elemzés és a glosszázott elemzés között) jelenik, illetve jelennek meg.

Nem elemzendő szöveg

A program nem elemzi az elemzőablak szövegmezejébe beírt szöveg azon sorait, amelyek # karakterrel kezdődnek. Így írhatunk be többek között fordítást az elemzendő mondathoz. Az így megjelölt sorok az elemzett kimeneten módosítás nélkül fekete színnel jelennek meg:

...

Generálás

Generáláskor a szövegmezőbe be kell írni a tövet.

Az ablak alján levő legördülő menüből balról jobbra haladva ki kell választani a szófajt és a többi morfológiai kategóriát.

A program mindig csak olyan lehetőségeket ajánl fel, amik az adott (relatív) tő esetében lehetségesek.

A párbeszédablak jobb alsó sarkában levő gomb megnyomásakor az ablak alatt megjelenik szürke színnel a párbeszédablakba beírt morfémasorozat, alatta pedig a kigenerált alak (amely az elemzésekhez hasonlóan fekete, ha csak egy lehetséges alakban valósulhat meg az adott morfémasorozat;

kék, ha több lehetséges alak van (ekkor is az egérmutatónak a szó fölé vitelével előbukkanó menüben láthatjuk a többi lehetséges alakot);

és ebben az esetben is szürke #### karaktersor jelenik meg, ha a generálás nem sikerült (pl. mert az adott tövet nem tartalmazza a morfológia, vagy nem megfelelő szófajt adtunk meg stb.)).

A generálás gomb csak abban az esetben nyomható meg, ha a legördülő dobozok használatával összeállított morfémasorozat utolsó tagjával végződhet szóalak az adott nyelvben. Tehát ha túl kevés információ szerepel az ablakban (pl. névszó esetén van esetrag, ám számjelölés nincsen), akkor a gomb felirata szürke és nem nyomható meg.

A generálás során (ellentétben azzal, ahogy az elemzések megjelennek) a toldalékmorfémák lexikai alakját és az elválasztó + jeleket nem kell (nem szabad) beírni. Egyébként a generálandó szóalakot leíró morfoszintaktikai jegyegyüttes (tő+morfoszintaktikai címkék) a legördülő dobozok használatának mellőzésével is beírható, és ilyenkor a generálás gomb is aktív (megnyomható).