Felépítés
Az UTCA egy fejlesztés alatt álló hibrid közös katalógus. Egyesíti magában a valódi- és a virtuális közös katalógusok előnyös tulajdonságait. A kereséseket a tagkönyvtárak adatbázisainak összedolgozásával épülő központi adatbázisból - a MOKKA-hoz hasonlóan - szolgálja ki, így gyors, a lelőhely-adatokat (kölcsönözhetőség, példányok száma és elérhetősége) viszont az egyes könyvárakból, a felhasználó kérésére, online módon kéri le, így mindig aktuális is. Az UTCA nem integrált könyvtári rendszer, hanem kifejezetten a közös katalogizálás speciális problémáinak megoldására készülő célszoftver.
Bemenet
A központi adatbázis építése az egyes könyvtárakból származó bibliográfiai és authority adatokból történik. Az adatok formátuma lehet US- vagy HUNMARC, de elfogadhatóak nem kifejezetten könyvtári szoftverek állományai is (pld. Excel, Access vagy dBase is). Bármelyik közhasználatban lévő karakter kódolás (ISO-8859-2, ALA, Unicode) elfogadható. Az UTCA nem határoz meg saját katalogizálási szabályzatot, elfogadja az egyes könyvtárak következetesen betartott saját szabályzatának megfelelő rekordokat.
Az adatok átadása a fejlesztési fázisban "batch" módban történhet, a teljes állományokat tartalmazó fájlok átadásával (CD-n vagy interneten át, szabványos email vagy FTP protokollal). A későbbi frissítéseket - az újonnan állományba kerülő dokumentumok begyűjtését - az egyes IKR/OPAC rendszerekhez illesztett, aktív lekérdező modulokkal végezzük majd. Az UTCA szervere által kezdeményezett frissítések emberi beavatkozás nélkül, pld. z39.50 protokollon vagy az OPAC lekérdezésével működnek majd, napi-heti sűrűséggel.
Feldolgozás
Az UTCA legfontosabb része a feldolgozó modul, melynek elsődleges feladata, hogy beazonosítsa az azonos dokumentumot, illetve művet leíró rekordokat. Ez nem a hagyományos értelemben vett duplum-ellenőrzés. A beazonosított rekordok nem egyetlen fő rekord további lelőhelyeivé vállnak, hanem csoportokat képeznek. Olyan rekordok csoportját, melyek egy adott dokumentum különféle kiadásait és nyelvi változatait tartalmazzák. Ebből történik a következő lépcsőben a kiadások pontosabb elkülönítése, és a dokumentumokban foglalt művek (novellák, tanulmányok) beazonosítása - mely azért fontos, mert az UTCA kimenete, megjelenési felülete elsősorban mű alapú keresést kíván megvalósítani.
A feldolgozás módja az ismert módszerektől több szempontból is eltér. A MARC formátumot csak a be- és kimeneti oldalon használja, belső felépítése sokkal inkább relációs szerkezetű - könyvtáros terminológiában ezt leginkább az FRBR-hez hasonlíthatnánk. A feldolgozás nem rekordonként, hanem rekordok csoportjain folyik - úgymond "madártávlatból". Egyszerre több rekordot vizsgálva több összefüggést vehet észre a rendszer, s a dokumentumok leírásában meglévő "sokszínűséget" előnyére fordíthatja. A feldolgozás nem lineáris, hanem ciklikus módon történik, egyes lépésekhez újra és újra visszatérve, az eredményeket tovább finomítva. Az algoritmusok egy része párhuzamosítható, így pld. 20 gép alkalmazásával sebessége közel 20-szorosára növelhető. A feldolgozás emellett egyaránt épít az emberi és gépi munkára is. A kulcskérdés ezek hatékony együttműködésének kialakítása - az, hogy az értékes emberi erőt ne rutinfeladatokra pazaroljuk el, hanem a nagysebességű gépi módszerek intelligens segítésére.
Ezen módszerek eredményeképpen olyan adatbázis jön létre, mely nagy pontossággal (terveink szerint kb. 95%) azonosítja be a dokumentumokat és műveket. Erre olyan szolgáltatásokat lehet építeni, melyeket a gyengébb duplumszűrés esetén képtelenség lenne. Egy szerző műveinek feltérképezése, egy dokumentum elérhetőségének beazonosítása az összes tagkönyvtárban igen gyorsan elvégezhető, ezt már a jelen stádiumban is bemutatjuk weboldalunkon elérhető bemutatónkban.
Kimenet
A bemenő adatok feldolgozásának végső célja természetesen az, hogy az egységes adatbázis kereshetővé váljon, s abból olyan "tanulságok" legyenek leszűrhetővé, melyek mind az olvasókat, mint a könyvtárakat szolgálják. Az UTCA adatbázisa a MARC adatokat elemeire bontva tárolja, így abban pontos és rugalmas keresések hajthatóak végre. Kereshetünk például konkrét közreműködőre (Robert Merle művei közé nem keverednek más Robertek és más Merlék művei). A szokásos egyszerű és összetett keresési lehetőségeken túl olyan adatokra is lehet pontosan keresni, melyre sok más OPAC-ban nem, mint például egy adott időszakról szóló művek, melyek relevancia szerint rendezve jelennek meg. Egy-egy személyre keresve megjelennek álnéven, vagy külföldön, más átírással leírt nevek alatt megjelent művei is. A kereső felületen a megfelelő jogosultsággal rendelkező felhasználók javításokat is eszközölhetnek majd az adatbázisban.
Az UTCA feldolgozási folymatainak kimenete nem csak az olvasókat szolgálhatja. Az a tudásbázis, ami az egymást kiegészítő könyvtári adatbázisok összeépítésével létrejön, szolgálhatja újra az egyes könyvtárakat. A könyvtárak saját adatbázisai is kiegészíthetőek például a műveket FRBR-szerűen összecsoportosító MARC mezőkkel, vagy authority állományuk is frissíthető, például egy időközben elhunyt szerző adataival, vagy más, évszámadatokkal nem rendelkező szerzők beazonosításával. Segíthetünk nekik analitikus feltárási adatokat, vagy digitális példányokat kötni a rekordjaikhoz. A művekre csoportosítás eredményét saját katalógusukba építhető "további kiadások" kereséssé alakíthatjuk.
Technikai háttér
Az UTCA fejlesztése nagyrészt szabadszoftverek felhasználásával történik (az adatbázistól a felhasználói felületig). Ingyenes, de emelett igen kiterjedt felhasználói bázissal és igény esetén fizetős támogatással is rendelkező szoftverek ezek. Sok esetben egymással a kereskedelmi szoftverekhez hasonlóan "versengő" fejlesztőkről van szó, melyek munkáját nagy forgalmú internetes alkalmazásokban találjuk meg. E kész komponenesek felhasználása gyors és rugalmas fejlesztést tesz lehetővé, melyet a kezdeti időszakban nem befolyásolnak költségtényezők. Operációs rendszer, adatbáziskezelő, teljes szövegű indexelő szoftver, helyesírás-ellenőrző és nyelvtani elemző szoftverek, webszerver - mind mind ilyen.
Státusz
A fejlesztés másfél éve folyik, a Könyvtári Intézet szakmai támogatásával. Az első fázisban a MOKKA-ból származó néhányezer rekordon teszteltük módszereinket, azóta több nagy és néhány kisebb is teljes állományával járult hozzá a további fejlesztéshez, amely nagymértékben segítette a munkát, hiszen a fő feladat ezek egyesítése. A nagy támogató könyvtárak: Corvinus Egyetem, ELTE, FSZEK, Miskolci Egyetem, MTAK, Országos Idegennyelvű Könyvtár, Pécsi Egyetem, SEK (volt Berzsenyi Dániel Főiskola). Weboldalunkon a Katalógus menüpont alatt elérhető fejlesztéseink demonstrációja.
Eredményeinket szaklapokban (TMT '07/7, Könyvtári Levelező/lap '07/6), konferenciákon (Közgyüjteményi napok, Networkshop), szakmai összejöveteleken mutattuk be. A friss hírekről a blogunkon olvashat.