Archívált honlap. Utolsó frissítés 2011. november 29.
A digitalizálás fő kérdései 8/7.
Milyen legyen az online megjelenés?

Digitalizált vagy már eredetileg is digitális anyagként létrehozott dokumentumainkat érdemes úgynevezett elektronikus könyvtárba rendeznünk. Ezt az elektronikus könyvtárat – hasonlóan a hagyományos könyvtárhoz – tematikus rendbe helyezhetjük, és virtuális katalóguscédulákkal láthatjuk el, hogy az „olvasóink” könnyebben eligazodhassanak szolgáltatott anyagaink között. Egy könyvtár akkor értékes, ha állománya folyamatosan bővül, anyagai gyorsan és hatékonyan kereshetőek!

A digitalizálási koncepció kialakításakor meg kell határoznunk az online megjelenés/megjelenítés formáját, ami nagyban függ egyrészt a technikai lehetőségektől, másrészt viszont a dokumentumok tartalmától is. A digitalizálandó dokumentumtartalmakat három fő csoportba oszthatjuk. Ez a beosztás lehet a kiindulópontunk, és a hierarchiát úgy célszerű elképzelnünk, mintha egy piramist szeretnénk megalkotni. A „piramis” alsó és egyben legszélesebb talapzata a dokumentum szkennelésekor keletkező képfájlok halmaza. Mivel minden dokumentum-szkennelés első terméke a keletkező képfájl, ezért ez a digitalizált nyersanyag, amivel a továbbiakban gazdálkodhatunk.

Célszerű 300 dpi felbontással szkennelni a dokumentumokat, hiszen az így keletkező képfájlokkal a későbbiekben tovább dolgozhatunk, ezeken karakterfelismerést (OCR) végezhetünk, amivel a képfájlok mellett szövegesítésre is szert tehetünk. Ezzel lehetőségünk lesz további megjelenítési formákat szolgáltatni, és akár full textes szövegkeresési lehetőségeket nyújtani a felhasználóknak.

Amennyiben gyorsan és nagy számban szeretnénk a digitális tartalmakat szolgáltatni, akkor a helyesen megválasztott, és a képernyőre optimalizált felbontásra konvertálva a nyers képfájlok másolatpéldányait egy lapozófelületbe ágyazva jeleníthetjük meg. A digitalizációs munka alapját képezi ez a lehetőség. Ezzel az adott dokumentum digitális képét – mint egy digitális „fénymásolatot” – szolgáltathatjuk a felhasználóknak. Ebben az esetben arra van lehetőségük a felhasználóknak, hogy a dokumentumot előre és hátrafelé végiglapozzák. Karakterkeresési opciókat ebben az esetben nem szolgáltatunk.

Ezzel az eljárással a dokumentum szkennelése után szinte azonnal látványosan szolgáltathatóvá válik a digitalizált mű.1 A munkafeladat részét képezheti annak kidolgozása, hogy hogyan lehetséges a szkennelés gyorsítása és az automatikus képfeldolgozás, azaz a képfájlok vágása és méretezése, illetve a lapozófelület kialakítása, mellyel a további dokumentumok lapozását is meg tudjuk majd oldani.

„Piramisunk” középső, kisebb szeletével határozhatjuk meg azoknak a dokumentumoknak a körét, melyeknél szükséges, hogy az alapvető előre/hátra lapozási funkcióknál több lehetőséget is kínáljunk a felhasználóknak. Készíthetünk a dokumentumoknak tartalomjegyzéket, vagy más „kívánt oldalra való ugrási lehetőséget”. Ezek közé tartozó dokumentumok már „fejlettebbek” a piramis alján lévőknél, hiszen a szolgáltatás már inkább felhasználóbarát, de ebben az esetben is a képlapozáson van a hangsúly.2

A digitális dokumentumok körében elterjedt formátum még a pdf kiterjesztésű fájlok szolgáltatása is. A pdf fájl formátum azért közkedvelt, mert a létrehozásához ingyenes programokat lehet használni3, ráadásul a fájlok olvasásához szintén több fajta ingyenes olvasó program4 is rendelkezésre áll. A pdf-eknél lehetőségünk van a képfájlok pdf-be való importálására, majd a lementés után akár a teljes dokumentum egyetlen fájlban válik hozzáférhetővé. Ezt a pdf dokumentumot linkként elhelyezhetjük a weboldalunkon, megspórolva így a lapozófelület elkészítését is. A pdf fájlt jelszóval is elláthatjuk, így a biztonsággal sem kell sokat foglalkoznunk.

Amennyiben az eredeti nyers képoldalakat legalább 300 dpi-vel szkenneltük, lehetőségünk van optikai karakterfelismeréssel (OCR) a képfájlokból kinyerni a szöveget, ezután a karakterfelismerési hibákat vagy javítjuk, vagy amennyiben százalékosan elhanyagolható a hibás felismerés, szöveges állományként elmenthetjük pdf-ben. Az ilyen pdf-állományok jóval kisebb fájlméretet eredményeznek, hiszen csak karakteresen került kódolásra a szöveg. Ez esetben a szöveg nem feltétlenül tartja meg az eredeti dokumentum oldaltördelését, így a felhasználók által való pontos oldal-hivatkozások hibákat eredményezhetnek.5

Ha pontos digitális másolatot szeretnénk készíteni, akkor azt is megtehetjük, hogy a pontos képoldalak is mentésre kerülnek a pdf-ben és a karakterfelismert szöveg is. Az így készült fájlok azonban nagyságrendileg több tízszeres fájlméretet jelenthetnek, azonban megjelenési „szépségük” az eredeti fizikai dokumentummal is vetekszik, ráadásul lehetőség van bennük a teljesszövegű keresésre is, ami egy több száz oldalas műnél nagyon hasznosnak bizonyulhat.6

A „piramis” csúcsán lévő, nagy munkát igénylő kiadványok köre a különböző bibliográfiák és repertóriumok köre lehet. Ezeknek az elkészítése és megjelenítése már sokkal több munkaórát jelenthet, viszont a kutatóréteg teljes kiszolgálását segítheti. Ebben az esetben kimondottan a tartalom a fontos, nem az eredeti dokumentum kinézetének megtartása.7 Ide sorolhatjuk azokat a műveket is, amik már eleve csak digitális formátumban jelentek meg, kimondottan a saját digitális könyvtárunk kiadásában. Ezeket a repertóriumokat különböző annotációkkal, referátumokkal, vagy hypertextes linkekkel láthatjuk el, segítve a kutatást.8

Fontos hangsúlyoznunk a kiválasztott tematikus gyűjtőkörünket, így a látogatók már előre tudhatják, hogy mi az, amit érdemes illetve nem érdemes keresniük virtuális könyvtárunkban. Könyvtárunkat több forrásból is továbbépíthetjük. Archiválhatunk az internet segítségével, azaz a gyűjtőkörünkbe tartozó dokumentumokat az internetről begyűjthetjük (megfelelő engedélyekkel, forrásmegjelöléssel). Megegyezhetünk egyes könyvkiadókkal, hogy bocsássák rendelkezésünkre régebbi kiadású könyveiket, dokumentumaikat. Tematikai gyűjtőkörünkbe tartozó kiadványok szerzőivel is megegyezhetünk, hiszen az internet adta lehetőségek számukra is ismertséget hozhatnak. Saját vagy mások által fejlesztett CD-Rom adatbázisainkat (megfelelő engedélyek birtokában) is szolgáltathatjuk web-felületen.

Amennyiben „kapott” dokumentumokat is szolgáltatunk, a korrektség érdekében fontos a szöveg- és minőség ellenőrzése, összevetése az eredeti papíralapú forrással. Amennyiben szükséges, a megfelelő karakter-konverziókat (ISO-8859-2, UNICODE) is el kell végeznünk. A legutolsó lépésben pedig célszerű – ha szükséges – a formátum-konverzió (HTML, PDF).

A digitalizálási munkánknak akkor van igazán értelme és haszna, ha a szolgáltatott dokumentumokat a felhasználók birtokukba is vehetik, és teszik ezt napról napra egyre többen. Ne feledjük: az internet népessége percről percre növekszik.


  • Forrás: Ambrus Attila József: A Gutenberg- és a Neumann-galaxis: Könyvek és könyvtárak, olvasók és könyvtárosok a harmadik évezredben (kézirat) PTE, FEEK, Könyvtártudományi Intézet, 2010
  1. Egy lehetséges mintaként lásd az alábbi weboldalt: Apróságok Lapja – A II. Gyakorló Általános Iskola aprajának lapja, (szerk.: Ambrus Attila József, Pécs, 1994. szeptember 5. – 1995. június) http://www.lib.pte.hu/elektkonyvtar/efolyoiratok/PTEdigitalizalas/AprosagokLapja/htm/index.html (2010.08.17.); vagy lásd Babics András: A Kamarai igazgatás Pécs városában 1686-1703. Pécs, 1937. digitális változatát, ahol a képlapozás mellett már a full textes szöveges megjelenítésre is lehetőség van. http://www.lib.pte.hu/elektkonyvtar/ekonyvek/elibrary/KamaraiIgazgatas/htm/index.html (2010.08.17.)
  2. Lásd például az Origo szoftverbázisban elérhető egyik kedvelt programot: novaPDF Standard Desktop v7.0B327 http://www.szoftverbazis.hu/szoftver/novapdf.html (2010.08.17.)
  3. Pl. az Adobe Reader az egyik legismertebb PDF dokumentumok megnyitására használható ingyenes szoftver. http://www.szoftverbazis.hu/szoftver/adobe-reader-v9--magyar.html (2010.08.17.)
  4. Lásd mintaként Chyzer Béla: A gyermekmunka Magyarországon. Budapest, 1909. c. kötet digitális verzióját: http://mtdaportal.extra.hu/books/a_gyermekmunka.pdf (2010.08.17.)
  5. Ez esetben kétrétegű pdf-ről beszélünk. Erre lásd példaként: Pintér Kálmán: Vázlatok Spanyolországi és Portugáliai utamról - A művelt közönség és a serdültebb tanuló ifjúság számára. Buschmann F. Könyvnyomdája, Budapest, 1900, http://www.lib.pte.hu/elektkonyvtar/ekonyvek/elibrary/PinterKalman/pdf/PinterKalman.pdf (2010.08.17.)
  6. Mintaként lásd A Magyar Családtörténeti Szemle repertóriuma 1935-1944 (összeáll.: Hernádi László Mihály). Budapest, Tarsoly Kiadó 2000. digitális változatát: http://www.lib.pte.hu/elektkonyvtar/repertoriumok/hernadicsaladtortenet/index.html (2010.08.17.)
  7. Mintaként lásd A Pécsi Szemle c. folyóirat repertóriumát (összeáll: Bánfai József – Káplárné Nagy Rózsa). Pécs, PTE Egyetemi Könyvtár, 2008: http://www.lib.pte.hu/elektkonyvtar/repertoriumok/pecsiszemle/index.html (2010.08.17.)