Zpřístupnění databáze článků ANSKAT prostřednictvím Jednotné informační brány

Předkládá

Sdružení uživatelů knihovních systémů LANius

Jiráskova 1775, Tábor 390 02

Tábor, leden 2004

Úvod projektu

   Tento projekt navazuje na projekt zpřístupnění souborného katalogu odborné literatury SKAT v rámci Jednotné informační brány (JIB), který byl úspěšně realizován koncem roku 2002. Souborný katalog knih je od té doby jednou z řady databází zpřístupněných jednotnou formou celé široké informační společnosti v rámci celosvětové sítě INTERNET. Sdružení však disponuje ještě druhou rozsáhlou databází, na jejímž vzniku se podílí také většina členů sdružení – veřejných knihoven. Jedná se o databázi ANSKAT obsahující excerpované články s periodik vycházejících v ČR. Tato databáze obsahuje téměř 330 000 článků a je aktualizována automaticky každé 2 hodiny. Díky spolupráci a kooperaci několika desítek knihoven obsahuje výběr článků z téměř 350 titulů časopisů a novin vycházejících v ČR. Jedná se o jednu z nejrozsáhlejší databází tohoto druhu s každodenní automatickou aktualizací, která by rozšířila bohatou nabídku zdrojů dostupných v rámci JIB. Proto více než 170 veřejných knihoven spojených ve Sdružení uživatelů knihovních systémů LANius předkládá tento projekt pro začlenění této databáze ANSKAT do Jednotné informační brány.

Charakteristika databáze

   V roce 1997 na výroční členské schůzi sdružení SKAT bylo navrženo realizovat druhou databázi - analytického popisu nazvanou později ANSKAT. Databáze článků vznikla na bázi modulu knihovního systému LANius, který je označován jako modul 6. Analytický popis. Díky organizaci a koordinaci členů dochází od počátku k dělbě práce. Jednotlivé tituly periodik výběrově excerpují určené členské knihovny tak, že dohromady je nyní v databázi 329113 článků z téměř 350 titulů periodik. Pro aktualizaci byla původně používána dávková metoda formou posílání médií. Od roku 1999 je využívána technologie firmy LANius nazvaná ANISH, která je odvozena z osvědčené sdílené katalogizace. Přehled kooperace je dostupný ONLINE na následující adrese: https://knihovny.net/l.dll?konfiganish

Podpora knihovnických standardů

   Všechny záznamy jsou v souladu s pravidly AACR2, výstup záznamů je podle ISBD normy pro fyzicky nesamostatné části dokumentů. Většina záznamů obsahuje povinná pole minimálního záznamu pro soubornou databázi jak jej definovala NK. Ze souborného katalogu lze získat v oprávněných případech výstup ve formě mezinárodního formátu UNIMARC, jak ve formě tagového výstupu tak i ve formě ISO 2709. V rámci chystaného převodu databáze do nových struktur bude otevřena cesta ke snadné implementaci exportu a importu záznamů ve formátu MARC21 včetně pozdější kompletní konverze do tohoto formátu. Z server i Z client podporují Bath profil verze 1.1 na úrovních shodnosti 0 a 1.

   Tabulka statistických údajů o databázi katalogu ANSKAT – prosinec 2003

Celkový počet titulů časopisů v ANSKAT

348

Celkový počet jednotlivých článků v ANSKAT

329.113

Počet klíčových slov ve slovníku ANSKAT

127.716

Celkový počet klíčových slov ve všech článcích

2.462.748

Průměrný počet klíčových slov na jeden záznam článku

7.48

   Vzhledem k velkému množství připojených záznamů analytického popisu a jejich aktuálnosti, roste i počet přístupů k této databázi vystavené na síti INTERNET již od roku 1999 v rámci domény www.skat.cz. Následující statistiky dokumentují vzrůstající objem vyhledávání a tím zátěže současného serveru.

Charakteristika přístupů k všem databázím na SKAT.CZ

   Následující grafy ukazují počty jednotlivých dotazů na WWW.SKAT.CZ.

   Růst využití souborného katalogu a databáze ANSKAT shrnuje následující graf:


Uvedené počty hledání jsou pouze přes vlastní vyhledávací nástroj a webové rozhraní. Nezahrnují počty dotazů realizovaných přes JIB od listopadu 2002.

Analýza současného stavu a cíl projektu

Současný hardware a systémový software

   PC INTEL Pentium III. 800 Mhz, 256 MB RAM, 2x 18 GB HDD, WINDOWS 2000 Server, Výrobce a typ: IBM @Server x200, Datum výroby: 11/2000

   Na tomto serveru je provozován WWW přístup ke SKAT, server byl zakoupen počátkem roku 2001 na základě projektu: Zlepšení přístupu do souborného katalogu po síti INTERNET v rámci grantového programu VISK3. Tento stroj je použit zároveň pro provoz Z39.50 serveru a datového interface pro přístup k datům souborného katalogu SKAT.

   Současná konektivita do sítě INTERNET: Sdružení využívá připojení Městské knihovny v Táboře o rychlosti 2 Mb/s prostřednictvím Jihočeské univerzity v Táboře k akademickému poskytovateli sdružení CESNET. Rychlost linky CESNET Tábor-Praha je v současné době 10 Mb/s. Sdružení právnických osob SKAT má povoleno sdružením CESNET bezplatné provozování serverů v rámci tohoto připojení.

Cíl projektu

   Kompletně transformovat stávající databázi ANSKAT do moderního prostředí struktury dovolující implementovat formát MARC21 a implementovat v rámci zakoupeného Z39.50 serveru přístup do databáze článků ANSKAT a tím umožnit její následné začlenění mezi zdroje v rámci JIB.

Softwarové řešení

   Konvertovat stávající zastaralé struktury databáze ANSKAT pomocí speciálního převodního programu. Zajistit následně změnu aktualizační technologie ANISH a úpravu webového rozhraní. Upravit a nakonfigurovat datový interface Z39.50 serveru pro databázi článků ANSKAT. Celé řešení implementovat a provozovat na novém serveru IBM nad OS Win2003.

Specifikace serveru

   IBM @server řady x235 s 1-2 procesory Xeon, 1 GB RAM, Ultra SCSI řadič HDD 2x36 GB

Spolupráce a součinnost

   Pro zdárnou realizaci je nutná spolupráce tvůrců JIB a subdodavatele SW Z39.50 serveru, ale vzhledem k předloňské realizaci připojení souborného katalogu knih je spolupráce ověřena.

Fáze realizace projektu

I. fáze projektu – Analýza a příprava (leden-březen-2004)

   V první fázi realizace projektu dojde k analýze stávajících záznamů analytického popisu v současné databázi ANSKAT. Bude využit i celkem podrobný materiál Dr. Anděrové, který byl vypracován s ohledem na možnou spolupráci při kooperaci článkové bibliografie v NK ČR. Cílem je připravit podrobné podklady pro fázi konverze databáze do nové struktury.

II. fáze projektu – Konverze databáze (březen-červen 2004)

   Ve druhé fázi bude zahájena transformace databáze do lineárních struktur nové databáze, která umožňuje importovat data v libovolném MARC formátu. Vzhledem k různým časovým vrstvám databáze bude nutné konvertor nastavovat a testovat několikrát. Cílem je získat co možná nejvíce homogenní databáze záznamů ve formátu UNIMARC/MARC21 tak, aby záznamy odpovídaly současným požadavkům z NK ČR.

III. fáze projektu – Znovuzprovoznění aktualizace databáze (červen-září 2004)

   Ve třetí fázi bude potřeba upravit unikátní technologii ANISH, tak aby dokázala automaticky aktualizovat databázi novými záznamy z členských knihoven bez ohledu zda mají systém LANius nebo Clavius. Komunikace bude realizována nadále pomocí HTTP protokolu přes standardní port 80, ale přenášená data budou přímo ve zvoleném MARC formátu.

IV. fáze projektu – Implementace nové databáze do Z39.50 serveru (září-říjen)

   Ve čtvrté fázi bude vyvinut program tzv. datový můstek (interface) mezi stávajícím Z39.50 serverem a novou databází, který je nezbytný pro začlenění databáze do Jednotné informační brány JIB. Konfigurace nového zdroje a testování nastavení s techniky JIB.

V. fáze projektu – finální nastavení a provoz (listopad – prosinec 2004)

   V páté fázi koncem roku 2004 počítáme s nákupem nového výkonného serveru IBM na procesorové platformě INTEL včetně moderního operačního systému Windows 2003, který by zajistil vysokou dostupnost serveru a dostatečný výkon pro další období a tím i dobré fungování dvou důležitých zdrojů začleněných do JIB.

Zdůvodnění žádosti

   Hlavním záměrem projektu je zpřístupnění databáze článků ANSKAT v rámci jednotné informační brány (JIB). Její progresivní služby již několik let úspěšně využívají účastníci sítě INTERNET a tím i sítě veřejných knihoven bez ohledu na používaný AKS. Tento projekt navazuje na předloňský projekt Zpřístupnění souborného katalogu SKAT prostřednictvím JIB jež si kladl za cíl začlenit jeden z existujících lokačních souborných katalogů do jednotné informační brány a zkvalitnit tak přístup do tohoto souborného katalogu naučné literatury. Toto se podařilo realizovat hlavně díky poskytnuté dotaci v rámci programu VISK MK ČR.

   Hlavním výsledkem bude začlenění dalšího významného informačního zdroje, jakým bezesporu databáze článků ANSKAT je, do nového progresivního prostředí jednotné informační brány, která integruje vyhledávání v široké škále různorodých zdrojů. JIB představuje další kvalitativní zlepšení přístupu občanů k informacím a spolu s rozvojem pokročilých funkcí WWW přístupu jako je například ONLINE propojení vyhledaného záznamu článku na plný text tohoto článku ať už je jeho fyzické umístění v rámci sítě INTERNET kdekoli.
Pro realizaci hlavního cíle bude nutné investovat úsilí do kompletní změny databáze, tak aby odpovídala standardům jako je UNIMARC a nově i MARC21. Bez této radikální změny by nebyla ani možná budoucí spolupráce při kooperaci s aktualizací báze ANL NK ČR. Zároveň se dále zhodnotí získané grantové prostředky v podobě dalšího využití stávající licence Z39.50 serveru z roku 2002.

   Na uvedeném projektu se přímo podílí více než 40 velkých i menších veřejných knihoven ČR ze 170 veřejných knihoven spojených ve Sdružení uživatelů knihovních systémů LANius. Členové Sdružení jsou rozmístěni po celém území České republiky, mezi členy je 35 bývalých okresních knihoven. Výrazný přínos cílů projektu spatřujeme v nízkých nákladech požadovaných na krytí rozpočtu při zapojení velkého množství knihoven.

Sdružení uživatelů knihovních systémů LANius
Jiráskova 1775, 390 02 Tábor, IČO 65018826
tel. 381 251 715, e-mail: info@skat.cz