Prototípus
Az utóbbi pár hetet egy prototípus felélesztésével töltöttük, mely a 2006-2007-ben végzett munka “gyümölcse”. Több elvarratlan szál is van benne, de ennek ellenére jól demonstrálja hogy milyen is (lenne) az általunk elképzelt MOKKA. A keresőfelületet rövidesen elérhetővé tesszük, most előzetesként összefoglaljuk a lehetőségeit. A felsoroltakon kívül további funkciók is fejlesztés alatt vannak, például a térkép és a tezaurusz alapú keresés, erről legközelebb, vagy a prototípus bemutatásakor írunk majd. Az UTCA projekt elképzeléseiről a januári TMT-ben is olvashatnak majd egy átfogó cikket.
Keresés
Keresni címre, névre, témára (tárgyszavak alapján) és a digitális dokumentumokban előforduló szavakra lehet. A címben kifejezésekre is, ha idézőjelek közé tesszük azokat. Kereshetünk több névre egyszerre is, pl. ha a név keresőmezőbe az írjuk “merle, réz”, akkor a Merle és a Réz nevű személyek közös műveit – értelemszerűen Robert Merle Réz Ádám által fordított könyveit kapjuk meg – “Robert Réz” könyveit nem.

Ha csak annyit írunk a név mezőbe, hogy “lajos”, akkor az ismertebb Lajosokhoz (Kossuth, Áprily, Kassák, Bárdos, stb.) kapcsolódó találatokat kapunk. Természetesen lesz lehetőség a többi “Lajos” listázására is, és direkte az ő könyveik megjelenítésére. “Csonkolásos” keresésre nincs lehetőség. Már maga a szó is ijesztő. Később viszont tervezzük a keresés nyelvészeti alapú támogatását, ami ennél sokkal nagyobb lehetőségeket rejt magában.
Duplum ellenőrzés
Az UTCA katalógus prototípusa a már sokszor említett mű szerinti csoportosításra törekvő algoritmus 2007-es változatát használja. Néhol igen jó eredményeket ér el, néhol, pl. az idegen nyelvű címeknél még nem annyira. Sokszor, ha több találat is jön egy címre, a plusz 1-2 találat egy-egy minimális adatokat felküldő könyvtár rekordja, míg az összes többi egy nagyobb csoportot alkot. 2007 óta sokat tanultunk, sok ezer rekordot átnéztünk – a következő iteráció már jobb eredményeket fog hozni. A prototípus csak a monografikus(nak látszó) rekordok feldolgozását tartalmazza. Az duplumszűrő algoritmus igény szerint könnyedén kicserélhető a MOKKA által jelenleg használt duplumkulcsos módszerre is.
Könyvismertetők és borítók
A találati listákban könyvismertetők és borítók is megjelennek. A kb. 30000 könyvismertető a Könyvtárportál (egyébként bármely más fejlesztő számára is elérhető) adatbázisából származnak. A borítókat a Moly.hu könyves közösségi portál fejlesztőjétől kaptuk meg – köszönet a rokonlélek fejlesztőjének! Az ismertetők és borítók illesztésében az egyes címekhez még vannak hibák – így könyvborítók jelennek meg a hangoskönyveknél is, s egy-egy címhez mindig ugyanaz jelenik meg, a Moly.hu ugyanis nem különbözteti meg a kiadásokat.

Lelőhelyek, státuszok és kérések
Rögtön a találati listában (a Könyvtárportálhoz hasonló kinyíló panelen) láthatóak az egyes lelőhelyek, s egyetlen kattintásra, néhány másodperc várakozás után az aktuális státuszuk is, vagyis hogy hol hány példány érhető el helyben, kölcsönzésre, és hány példány van éppen kikölcsönözve. Az egyes dokumentumoknál raktári illetve könyvtárközi kérés indítását lehetővé űrlapok is vannak – persze ezeket össze kéne kötni a megfelelő kiszolgáló rendszerekkel, IKR-ekkel.
Digitális dokumentumok
Az UTCA prototípus kezeli a MEK, a DIA és az MTDA állományát. Rögtön a találati listában – egy kis kék E betűvel – jelzi, ha egy-egy dokumentumból van digitális változat.

Az elérhető digitális dokumentumokra mutató linkek mellett magukat a dokumentumokat is el lehet olvasni, rögtön katalógus felületen belül. A PDF formátumban elérhető állományokat (MEK, MTDA) másolásvédetten, csak az oldalon belül megnézhetően jeleníti meg. Ugyan a másolásvédelemre itt nincs szükség, hiszen szabadon elérhető anyagokról van szó, mindez jól demonstrálja a használt technológiát, amely például a digitálisan kért könyvtárközi kérések “elküldésére” használható, úgy, hogy csak a címzett láthassa azt. Lapozni, keresni lehet a dokumentumokban, de menteni vagy nyomtatni elvileg nem. Persze ha valaki nagyon ügyes… de az úgyis bármit lemásol.

Teljes szövegű keresés
Az elérhetővé tett digitális dokumentumok többsége, közel 8000, teljes szövegű kereséssel is megközelíthető, természetesen a többi keresési szemponttal kombinálva is. Könnyen megtudhatjuk például, hogy Gyurkó László 19 elérhető műben említi a “lehetetlen” szót. Az indexelés minősége még tovább javítható majd, mert most pl. csak teljes szavakra lehet keresni, és csak a használt formájukra, szótövek alapján nem. A találatoknál megjelenik a szövegkörnyezet is, de még nem mindig a a megfelelő.

Könyvtárportál integráció
A könyvismertetők megjelenítésén kívül a felület elvileg ugyanazokat a szolgáltatásokat nyújthatná a kereséshez kapcsolódóan, mint a konyvtar.hu: kedvencek megjelölése, polcok létrehozása és megosztása, hozzászólás a könyvekhez, de ezek jelenleg csak jelzésértékűen vannak jelen a prototípusban – a felület ott van, de mivel nincs regisztráció, és a mögöttes funkciók sincsenek bekötve, menteni nem lehet semmit. Hely (felület) viszont van raktári vagy akár ODR kérések indítására is, melyek majd eljuthatnak a leendő ODR kéréskezelő rendszer felé is.
Alapanyag
Hogy milyen nagy lehetőségek vannak egy közös katalógusban, csak úgy lehet megmutatni, ha rendelkezünk megfelelő mennyiségű alapanyaggal – jelen esetben a sok-sok rekorddal. Az UTCA konzorciumnak immáron tagja egy MOKKA tagkönyvtár is, s így a MOKKA alapszabály 6.3 pontja alapján lehetőségünk nyílt “Korlátozások nélkül igénybe venni a MOKKA projekt információs vagyonát”. A prototípus így az “igazi” MOKKA 2006-os állapotának teljes rekordkészletét használja.

Ezzel a lehetőséggel nem akarunk visszaélni, nem kívánunk “alternatív mokkát” létrehozni. A prototípus csak átmeneti ideig, pusztán a lehetőségek bemutatásának céljával fog üzemelni. A találatok nem fognak szerepelni a Google keresőben, ellentétben a Könyvtárportál oldalaival, ahol ez kifejezetten cél volt.
Folyt. köv.
Kérdéseket, hozzászólásokat továbbra is örömmel várunk. Legközelebb a közbeszerzési pályázat mikéntjéről, az esélyegyenlőség fontosságáról, és megteremtésének módszereiről lesz szó. Feltehetően ezek már kicsit elkésetten érkeznek, hisz a menetrend szerint lassan el is készül a MOKKA bizottság tanulmánya, és beindul a pályáztatás. Kíváncsian várjuk.
2 hozzászólás — Kategória: bemutatkozás — UTCA @ 9:13 de.
Megakadt a szemem a DIA, MEK + keresés szavakon. Én – nem könyvtárosként, hanem informatikusként – afféle idézetkeresővel közelítem meg a DIA és MEK szövegeit. Nem tárolok semmit, csak hivatkozok. A feladat célja egy ma elvárható színvonalon működő szövegindexelő/kereső, amely szabadon elérhető a netes közönségnek.
A http://dike.zakk.hu messze nincs kész, afféle alapkő, amelyre fokozatosan lehet építeni (”release soon and often”). Egyelőre pár DIÁ-s és MEK-es szerző műve van indexelve – tesztelés céljából. A keresőgépezet nem házi barkács, bővíthető, stabil és skálázható.
Például: http://dike.zakk.hu/?q=kucsma&length=5
Amennyiben publikus, szívesen olvasnék a használni kívánt indexelőről, keresőről, nyelvi lehetőségekről.
üdvözlettel
czinkos
Mivel ez itten egy verseny (pályázat) lesz, amire készülünk, oly annyira még nem publikus, hogy milyen sok ötletünk van és azt hogyan. De kicsit később majd az lesz. Addig is írok emailt…