Első világháborús dokumentumok térképes adatbázisa
Az első világháború centenáriumának alkalmából a Hadtörténeti Könyvtár egy térképes megjelenítőre épülő digitális dokumentumtárat hozott létre. A portál az első világháborúban szolgáló magyar alakulatok információs portálja, amelyet a www.magyarezredek.hu címen lehet elérni. A portált a megalkotója, a könyvtár munkatársa, Mohácsi Zoltán mutatja be számunkra.
Az elektronikus oldalon olvashatóak és teljes szövegben kereshetőek az alakulatok tevékenységét feldolgozó könyvek, fegyvernemtörténetek, arcképcsarnokok és vitézi tettek gyűjteményei. A térképes megjelenítésnek köszönhetően egy látványos és innovatív rendszer használatát kínáljuk, amely térkép- és fegyvernemválasztók segítségével részletes információkat nyújt az alakulatokról.
A keresett dokumentumhoz eljuthatunk a főmenüből, emellett a térképen keresztül kiválasztott ezred adatlapjáról is. A dokumentumok teljes terjedelmükben olvashatók. A portálon lehetőség van teljes szövegű keresésre egyszerű keresőben, valamint a különböző szűrők és operátorok segítségével összetett keresésre.
A térképes nézet mellett az adatbázis egyediségét az adja, hogy minden dokumentumoldalt egyenként metaadatoltunk. Jellemzően személy után kutatnak ezekben a könyvekben, s így a metaadatok segítségével könnyen találnak róla arcképet, életrajzi adatot vagy éppen fegyvertényt. Fontos kiemelnünk, hogy a portál nem tartalmazza az összes első világháborúban szolgáló katona adatait. A Hadtörténeti Könyvtár és a Hadtörténeti Múzeum Könyvgyűjteménye ezredtörténeteinek a kereshetősége a portál elsődleges feladata. Tehát nem pótol veszteségi adatokat, személyi kartonokat vagy éppen kitüntetési felterjesztéseket.
Könyvolvasó funkció a portálon
Alakulatok adatlapjai
Az összes magyar hadkiegészítésű alakulatnak készítettünk adatlapot, melyeknél törekedtük a legpontosabb és legrészletesebb leírásra. Az adatlapokon is megtaláljuk az egyes alakulatokhoz tartozó dokumentumok elérhetőségét. Tartalmaz az adatbázis olyan gyűjteményes munkákat, amelyekben több alakulatról is írnak. Ebben az esetben úgy alakítottuk ki a dokumentum elérését, hogy arra az oldalra jutunk, amelyiken kezdődik a róla szóló rész. Nem minden alakulathoz tartozik könyv, de van olyan is, amelyikhez ötöt is hozzá tudtunk kapcsolni.
A legtöbb császári és királyi alakulatnak volt indulója is. Úgy gondoltuk színesítené az oldalt, és hatásos lenne, ha az alakulatok adatlapjának megtekintésénél lehetőség lenne ezt az indulót meg is hallgatni. Egy ikonra rákattintva, a böngésző új lapján indul el a zene. Az egyenruhák színeit pedig nemcsak írásban ismertettük, hanem képi formában is elhelyeztük az adatlapon
Az alakulatok nagy részéhez tartozó csapatjelvények megtalálhatóak a Hadtörténeti Múzeum Numizmatikai gyűjteményében. Ezek digitális másolatait hozzákapcsoltuk az egyes ezredekhez, amelyek megjelennek az adatlapokon. Rákattintva egy nagyobb, jobb felbontású kép nyílik meg a böngészőben.
A kutatásunkhoz szükséges megkerülhetetlen forrás a császári és királyi alakulatok tekintetében a Schematismus für das K. u. K. Heer und für die K. u. K. Kriegsmarine, a magyar királyi honvéd alakulatokhoz pedig A magyar királyi Honvédség és Csendőrség névkönyve című periodika – amelynek az 1914. évi számát használtuk fel. Ezen adattárak évenként jelentek meg és az adott évre vonatkozóan közölték a tisztekről az adatokat: az adott évben egyes tisztek melyik alakulatnál szolgáltak, milyen rangban, és milyen kitüntetései voltak. Nagyon jól rendszerezett kiadvány, amely összegzi a haderő tisztjeinek szolgálatban töltött éveit. Különösen érdekesek az 1914. évi kiadványok, amelyekben az alakulatokról is sok adatot közölnek. Emellett kiváló kutatási alapként szolgáltak a következő dokumentumok:
- Szakonyi Lajos – Markó Árpád et al.: A magyar huszár. A magyar lovaskatona ezer évének története. Budapest, Reé, 1936.
- Jacobi Ágost: Magyar műszaki parancsnokságok, csapatok és alakulatok a világháborúban. Budapest, 1938.
- Czeigler Gusztáv – Clauser Mihály et al.: A magyar tüzér. A magyar tüzérség története. Budapest, Reé, é. n.
- Doromby József – Reé László (szerk.): A magyar gyalogság. A magyar gyalogos katona története. Budapest, Reé, é. n.
- Österreich-Ungarns bewaffnete Macht 1900 – 1914 [elektronikus dokumentum]
Térképes megjelenítés
Az 1914. évi Magyar Királyság térképét digitalizálni kellett és ebben a honvédkerületeket valamint a Császári és Királyi térképen a hadtesteket körberajzolni, hogy külön egységként használhassuk őket.
Mivel a fegyvernemválasztók bekapcsolásával növekszik a térképen megjelenő alakulatok száma, így meg kellett oldanunk, hogy áttekinthető maradjon az oldal akkor is, ha 2 vagy annál több hadrendi szám jelenik meg egy kerületen belül. A hadrendi számok úgynevezett markerekként, azaz jelölőként jelennek meg a térképen a központi koordinátákra pozícionálva. Ha egynél több hadrendi szám is aktív a térképen, akkor azok száma jelenik meg. Például, ha császári és királyi térképen aktív a tüzérség fegyvernemjelölő, akkor Nagyszeben körzetében egy piros 3-as szám jelenik meg. Ha tovább nagyítunk a térképen, vagy belekattintunk a 3-as számba, akkor megjelenik a feloldás a három alakulatra. Így a cs. és kir. 36. számú tábori ágyúsezred, a cs. és kir. 12. számú nehéztarackos osztály és a cs. és kir. 12. számú tábori tarackos osztály jelölői. A körzetközpontok mellett a kerületi katonai parancsnokságot, a hadkerületi kiegészítő parancsnokságot és a törzs helyőrséget is jelöltük a térképen. Ezekhez szintén a koordinátáik megadására volt szükség.
Intro
A portállal a határon túliakat és külföldieket is szeretnénk megszólítani. Mivel nem feltétlenül egyértelmű mindenki számára hogy ez a térképrészlet a Magyar Királyság 1914. évi állapotát jeleníti meg ezért szükségesnek tartottuk egy intro elkészítését. Ebben Európa térképpel kezdődik az animáció, amelyből előtűnik az Osztrák–Magyar Monarchia területe, majd a jelenlegi állapot. Ezzel a rövid bevezetéssel egyértelműsítjük, hogy mit is lát pontosan a felhasználó. Az intro természetesen átugorható, valamint beállítható, hogy ne jelenjen meg újra.
Technikai háttér
A digitalizált anyagot Abby Fine Reader Engine 11-es verzióval OCR-eztük. Az OCR programok azonban nem 100%-osan ismerik fel a karaktereket. A felismerési arány körülbelül 98 %-os. Bármennyire is jónak mondható ez, egy főként személynevekre összpontosító adatbázis esetében kevés. Gondoljunk bele abba, hogy ez a 98% azt jelenti, hogy egy oldalon 100 szóból 2-t hibásan ismer vagy ismerhet fel a szoftver. Ez máris csökkenti az adatbázis értékét, hiszen könnyen elképzelhető, hogy a felhasználó által keresett személynél történik ez a hiba.
Bár elenyésző a 2%-os hibalehetőség, mégis úgy döntöttünk, hogy a szövegeket manuálisan is korrektúrázzuk. Ez azt jelenti, hogy a gépi karakterfelismerés után a beolvasott oldalakat szabad szemmel is végignézzük. Egy olyan adatbázisban, ahol nem csupán az egyes kulcsszavas keresésre történő legrelevánsabb találatok megjelenítése a cél, hanem konkrét és pontos helyek, adatok, nevek megtalálása, ott muszáj manuálisan is korrektúrázni a teljes szöveget. Ha egy személynév a sor végén van elválasztva például:
Hor-
váth Tamás
akkor a keresőmotor csak abban az esetben ad találatot a „Horváth Tamás” keresőszóra, ha az ocr felületen az egybeírt alakja van. Ezért a Hor- szórészletet a sor végén ki kellett egészíteni Horváthra, a következő sorban levő váth részt pedig törölni. Időigényes és nagy fegyelmet igénylő feladat, de az eredményesség és a szakmai precizitás megkövetelte ezt a munkafolyamatot. Természetesen ugyanígy kellett eljárni a földrajzi nevek esetében is, ami az adatbázis jellegéből adódóan szintén gyakori keresőkifejezés, valamint a többi tulajdonnév esetében is hasonlóan kellett eljárni.
Ahhoz, hogy pontos találatot kapjunk, a keresett személyre használjuk az idézőjelet. Ebben az esetben csak azok a találatok lesznek a listánkban, ahol egymást követi a vezetéknév és az utónév.
Találati lista Arz Artúr tábornokra
Az alakulattörténetek könyvészetileg abból a szempontból is érdekesek, hogy vannak benne jellemzően elkülöníthető részek. Egyes típusoknál az első néhány száz oldalon csataleírások vannak térképekkel gazdagítva, a katonák behívásától a háború végéig. Ezután következnek az életrajzi adatok, veszteségi listák, ezt követően pedig az arcképcsarnok. Egy másik típusnál személyekre lebontva tagolták a könyveket, minden egyes fejezetben az adott személy fegyvertényét, hőstettét írták meg nagyon olvasmányosan. Ezek a tipizálások ösztönöztek minket arra, hogy a könyvek egyes oldalait metaadatoljuk, segítve az összetett keresést. Öt tárgyszó közül választhattak a korrektorok:
- veszteség
- életrajz
- arcképcsarnok
- térkép
- fegyvertény
Fontos kiemelni, hogy nem minden oldalhoz rendeltünk hozzá tárgyszót, csak abban az esetben, ha valóban egyértelműen jellemző az oldalra a megadottak közül valamelyik. Több tárgyszó is hozzárendelhető egyes oldalakhoz, hiszen ilyen típusúak is vannak. Az összetett keresésnél nagyon fontos szerepe van a tárgyszavaknak. Az olvasószolgálati tapasztalatok alapján ezek a leggyakrabban használt keresőkérdések a katonaősök utáni kutatásokban.
A portál bal felső sarkában levő lenyitható, úgynevezett hamburger menüben találjuk az összetett keresés funkciót. A megszokott boole operátorok mellett találjuk a térképválasztó gombokat is. Ezzel szűkíthetjük a keresésünket a Magyar Királyi Honvédség vagy a Császári és Királyi Hadsereg hadkiegészítési területeire is. Ha kiválasztom a tárgyszavak közül, hogy arcképcsarnok, a teljes szöveghez pedig beírom, hogy „Nagy József”, akkor az összes olyan oldalt kiadja a találati listában, ahol Nagy József arcképe megtalálható. Ugyanígy lehet a fegyvertény, a térkép, és az életrajz tárgyszavakra is szűrni.
A magyarezredek.hu portált hasznos tartalom és látványos megjelenés jellemzi, a 21. században nagyon fontos, hogy az oldalt már a gyakran forgatott mobil eszközökön is elérjék. Komoly segítséget nyújt a portál kutatómunkához, legyen az hadtörténelmi kutatás vagy katonaősök adatainak megtalálása. A teljes szövegű kereshetőség a speciális metaadatokkal növeli az adatbázis értékét. Az oldalankénti tárgyszavazás és a térképválasztó erre a speciális anyagcsoportra nagyon jól alkalmazható, de reméljük sikerült ezzel ötletet adnunk további könyvtáraknak is a metaadatok efféle alkalmazására. Emellett bízunk benne, hogy a bemutatott technológiákat tudják majd hasznosítani a digitális dokumentumszolgáltatásban. Mindenképpen szeretnénk továbbfejleszteni a portált, és az ellenőrzések során észlelt hibákat igyekszünk minél hamarabb javítani. Reméljük sok hasznos információt sikerül ezzel átadnunk, és az eredményes keresésekkel mindenki megtalálja a számára fontos adatokat és személyeket.