Zkvalitnění tvorby a zpřístupnění databáze monografií SKAT

Předkládá

Sdružení uživatelů knihovních systémů LANius

Jiráskova 1775, Tábor 390 02

Tábor, leden 2008

POPIS PROJEKTU

  1. Současný stav

    Charakteristika databáze

    Souborný katalog SKAT zahrnuje naučnou literaturu pro dospělé i mládež, regionální literaturu a mapy. Jeho hlavním účelem byla a je racionalizace zasílání meziknihovní výpůjční služby (MVS). Na jeho tvorbě se podílí všechny členské knihovny. V prosinci 2007 je to 192 veřejných knihoven ČR. Kromě nich přispívají do souborného katalogu i SVK Ústí nad Labem a KVK Liberec. Souborný katalog vzniká v sídle Sdružení, kde je doplňován a jeho aktuální verze je zároveň vystavována do sítě INTERNET ve čtvrtletním intervalu. Účastnické knihovny ale i většina dalších veřejných knihoven využívají souborný katalog jako primární zdroj pro zadávání požadavků meziknihovní výpůjční služby (MVS).

    Tabulka statistických údajů o databázi katalogu SKAT – prosinec 2007

    Celkový počet titulů ve SKAT

    288.197

    Celkový počet exemplářů ve SKAT

    3.257.559

    Počet klíčových slov ve slovníku SKAT

    226.983

    Celkový počet klíčových slov ve všech titulech

    5.298.217

    Průměrný počet klíčových slov na jeden titul

    18.38

    Současný stav využívání databáze

    Současný hardware a systémový software:

    1x INTEL Xeon 3 GHz, 3 GB RAM, Ultra SCSI řadič HDD 3x36 GB, Windows 2003 Server

    Výrobce a typ: IBM @server řady x235, Datum výroby: 6/2004

    Na tomto serveru je provozován WWW přístup ke SKAT. Server byl zakoupen v polovině roku 2004 na základě projektu: Zpřístupnění databáze článků ANSKAT prostřednictvím Jednotné informační brány v rámci grantového programu VISK8. Tento stroj je použit zároveň pro provoz Z39.50 serveru a datového interface pro přístup k datům souborného katalogu SKAT.

    Současná konektivita do sítě INTERNET:

    Sdružení využívá připojení Městské knihovny Tábor k poskytovateli Internetu, kterým je dlouhodobě sdružení CESNET. Sdružení právnických osob SKAT má povoleno sdružením CESNET bezplatné provozování serverů v rámci tohoto připojení.
     

  2. Cíle projektu

    Kompletně transformovat stávající databázi SKAT do prostředí struktury dovolující implementovat formát MARC. Modernizovat softwarové nástroje používané pro stahování záznamů, jejich aktualizaci a titulování. V rámci zakoupeného Z39.50 serveru posílit výkon pro přístup do databáze SKAT a tím umožnit její lepší využití mezi zdroji v rámci JIB.

    Softwarové řešení

    Konvertovat stávající zastaralé struktury databáze SKAT pomocí speciálního převodního programu. Zajistit následně změnu technologie pro stahování záznamů, jejich aktualizaci a titulování a konfiguraci standardního webového rozhraní. Upravit a nakonfigurovat datový interface Z39.50 serveru pro databáze SKAT a ANSKAT. Celé řešení implementovat a provozovat na novém výkonném serveru IBM s operačním systémem Windows server 2003.

    Hardwarové řešení

    Nákup PC serveru IBM System x3650 v provedení se 2 procesory INTEL Dual Core a diskovou kapacitou 180-300 GB v poli RAID 5. Záruka 3 roky. Příplatek za servis typu NBD po dobu záruky. Záložní zdroj typ: APC Smart-UPS 1000VA USB & Serial RM 1U 230V.

    Spolupráce a součinnost

    Pro zdárnou realizaci je vhodná spolupráce tvůrců JIB a subdodavatele SW Z39.50 serveru, ale vzhledem k modernizaci souborného katalogu článků v roce 2004 je spolupráce ověřena.
     

  3. Navrhovaný postup realizace

    (Uveďte popis technického řešení, přehled nakupovaných zařízení a služeb, případně harmonogram, odborné zajištění realizace projektu, spolupracující instituce, firmy, odhadovanou pracovní kapacitu, kalkulaci nákladů, dodržování standardů, zdůvodněte uplatnění atypického a nákladného řešení apod. Další nezbytné údaje případně vložte do přílohy projektu)

    I. fáze projektu – Analýza a příprava (leden-březen-2008)
    V první fázi realizace projektu dojde k analýze stávajících záznamů analytického popisu v současné databázi SKAT. Bude využito zkušeností při realizaci transformace databáze ANSKAT z roku 2004. Cílem je připravit podrobné podklady pro fázi konverze databáze do nové struktury a harmonogramu jednotlivých kroků.

    II. fáze projektu – Konverze databáze (březen-červen 2008)

    Ve druhé fázi bude zahájena transformace databáze do lineárních struktur nové databáze, která umožňuje importovat a exportovat data v libovolném MARC formátu. Vzhledem k různým časovým vrstvám databáze bude nutné konvertor nastavovat a testovat několikrát. Cílem je získat co možná nejvíce homogenní databázi bibliografických záznamů ve formátu UNIMARC/MARC21 tak, aby záznamy odpovídaly současným požadavkům.

    III. fáze projektu – Znovuzprovoznění aktualizace databáze (červen-září 2008)

    Ve třetí fázi bude potřeba upravit technologii sběru záznamů, jejich automatizovaného titulování a nástroje na ruční dotitulování do prostředí nové databáze. Komunikace bude realizována nadále pomocí HTTP protokolu přes standardní port 80, ale přenášená data budou přímo ve zvoleném MARC formátu. Předpokládá se využití protokolu OAI-PMH.

    IV. fáze projektu – Implementace nové databáze do Z39.50 serveru (září-říjen 2008)

    Ve čtvrté fázi bude upraven program tzv. datový můstek (interface) mezi stávajícím Z39.50 serverem a novou databází, který je nezbytný pro začlenění databáze do Jednotné informační brány JIB. Rekonfigurace stávajícího zdroje a testování nastavení s techniky JIB.

    V. fáze projektu – finální nastavení a provoz (listopad – prosinec 2008)

    V průběhu roku 2008 počítáme s nákupem nového serveru IBM na procesorové platformě INTEL včetně moderního operačního systému Windows 2003 R2, který by zajistil vysokou dostupnost serveru a dostatečný výkon pro další období a tím i dobré fungování dvou důležitých zdrojů začleněných do JIB.
     

  4. Očekávané výsledky řešení, charakteristika výstupů, přínos řešení

Hlavním záměrem projektu je zkvalitnění zpřístupnění databáze monografií naučné literatury SKAT v rámci jednotné informační brány (JIB). Její progresivní služby již několik let úspěšně využívají účastníci sítě INTERNET a tím i sítě veřejných knihoven bez ohledu na používaný AKS. Tento projekt přímo navazuje na projekt Zpřístupnění souborného katalogu SKAT prostřednictvím JIB jež si kladl za cíl začlenit jeden z existujících lokačních souborných katalogů do jednotné informační brány a zkvalitnit tak přístup do tohoto souborného katalogu naučné literatury. Toto se podařilo realizovat díky poskytnuté dotaci v rámci programu VISK MK ČR.

Hlavním výsledkem bude modernizace významného informačního zdroje, jakým bezesporu databáze monografií naučné literatury SKAT je, do nového progresivního prostředí a zlepšení její dostupnosti v rámci jednotné informační brány, která integruje vyhledávání v široké škále různorodých zdrojů. JIB představuje další kvalitativní zlepšení přístupu občanů k informacím a spolu s rozvojem pokročilých funkcí WWW přístupu, jako je například ONLINE propojení vyhledaného záznamu na webový katalog knihovny pro zjištění dostupnosti tohoto dokumentu, ať už je jeho fyzické umístění v rámci sítě INTERNET kdekoli. Pro realizaci hlavního cíle bude nutné investovat úsilí do kompletní změny databáze tak, aby odpovídala standardům jako je MARC21. Bez této radikální změny by nebyla ani možná budoucí spolupráce při kooperaci a aktualizaci souborného katalogu ČR. Zároveň se dále zhodnotí dříve získané grantové prostředky v podobě dalšího využití stávající licence Z39.50 serveru z roku 2002.

Na uvedeném projektu se přímo podílí více než 190 velkých i menších veřejných knihoven ČR spojených ve Sdružení uživatelů knihovních systémů LANius. Členové Sdružení jsou rozmístěni po celém území České republiky, mezi členy je 35 bývalých okresních knihoven a dvě krajské knihovny. Výrazný přínos cílů projektu spatřujeme v nízkých nákladech, požadovaných na krytí rozpočtu při zapojení velkého množství knihoven.

ROZPOČET PROJEKTU

(Všechny ceny uvádějte včetně DPH)

  Požadavek na dotaci Vlastní prostředky

(finanční spoluúčast)

Náklady projektu celkem

Celkové náklady projektu (Kč):

297.500,-

130.900,-

428.400,-

Vyjádřete v procentech poměr mezi požadovanou dotací a náklady hrazenými z ostatních zdrojů (v %)

69,5%

30,5%

100%

Investiční náklady projektu:

Položka:

Požadavek na dotaci Vlastní prostředky Investiční náklady projektu celkem

Server IBM systém x3650

190.400,-

   

instalace a konfigurace nového serveru

 

17.850,-

208.250,-

Úprava technologie SW pro aktualizaci dat

 

65.450,-

65.450,-

       

Celkem investiční náklady:

190.400,-

83.300,-

273.700,-

Neinvestiční náklady projektu:

Položka:

Požadavek na dotaci Vlastní prostředky Neinvestiční náklady projektu celkem

1) nákupy - drobný hmotný majetek – UPS

23.800,-

 

23.800,-

-drobný dlouhodobý nehmotný majetek – SW – datový interface, Windows serv.

47.600,-

29.750,-

77.350,-

2) služby – konverze dat – konfigurace

35.700,-

17.850,-

53.550,-

3) ostatní osobní náklady (OON)

     

4) ostatní

     

Celkem neinvestiční náklady:

107.100,-

47.600,-

154.700,-

KOMENTÁŘ ROZPOČTU

Celkové náklady: (tzn. součet všech nákladů na projekt: vlastní, příp. další zdroje + dotace v Kč.)
Celkové náklady na projekt činí 428.400,-Kč

Investiční náklady: (Přesně specifikujte jednotlivé položky uvedené v tabulce viz příloha č. III. včetně jejich vyčíslení v Kč)
CELKEM investiční náklady 273.700,-Kč

HIM Server IBM, x3650 a jeho instalace a konfigurace        
NIM SW Úprava technologie SW pro aktualizaci databáze                  

investiční náklady: (Přesně specifikujte jednotlivé položky uvedené v tabulce viz příloha č. III. pod body 1), 2), 3) a 4) včetně vyčíslení v Kč. )
CELKEM: neinvestiční náklady 154.700,-Kč

1.DHM Záložní zdroj UPS 23.800,-
1.DNM SW Windows 2003 server SE +10 CAL + 10 TS CAL 29.750,-
1.DNM SW Datový interface Z serveru pro novou databázi SKAT 47.600,-
2.Konfigurace stávajícího Z39.50 17.850,-
2. Konverze databáze SKAT do nové struktury MARC 35.700,-
 

Charakteristika přístupů k všem databázím na WWW.SKAT.CZ

Vzhledem k velkému množství připojených záznamů monografií a jejich aktuálnosti díky propojení na lokální webové katalogy knihoven roste počet přístupů k této databázi, vystavené na síti INTERNET již od roku 1999 v rámci domény www.skat.cz. Následující statistiky dokumentují vzrůstající objem vyhledávání a tím zátěže současného serveru.

 

 

Růst využití souborného katalogu a databáze SKAT shrnuje následující graf:


Uvedené počty hledání jsou pouze přes vlastní vyhledávací nástroj a webové rozhraní. Nezahrnují počty dotazů realizovaných přes JIB od listopadu 2002.

Z prezentovaných výsledků je patrné jak v posledních dvou letech markantně stoupá využívání databází monografií SKAT a článků ANSKAT. Domníváme se, že faktorem je i velké množství malých obecních knihoven, které se díky projektu internetizace knihoven (PIK) připojili do sítě a začínají využívat informační zdroje.

Začlenění databází SKAT a ANSKAT do jednotné informační brány pomocí Z39.50 serveru, který provozuje naše sdružení na stejném serveru, znamenalo další nárůst využití databází. Jedině díky modernizaci databáze ANSKAT v roce 2004 jsme mohli dosáhnout srovnatelných rychlostí vyhledání výsledků jako další hlavní databáze článkové bibliografie nabízené v JIB v rámci sekce České články.

Proto v rámci obdobného přechodu celé databáze monografií SKAT do moderní struktury výkonné databáze MySQL v.5.0 s datovým engine INNOdb a plánovaného nasazení vícevláknového (multithread) rozhraní pro Z39.50 server dosáhneme obdobného zlepšení výkonnosti a robustnosti databáze.

Konektivitu serveru sdružení SKAT do sítě Internet zajišťuje dlouhodobě sdružení CESNET. Dostupnost a kvalita připojení serveru sdružení SKAT je na velmi vysoké úrovni a sdružení SKAT i v budoucnu plánuje využívat tento způsob připojení zejména vzhledem k možnosti úzké integrace s dalšími významnými informačními zdroji na téže síti. (www.jib.cz)

 

Sdružení uživatelů knihovních systémů LANius
Jiráskova 1775, 390 02 Tábor, IČO 65018826
tel. 381 251 715, e-mail: info@skat.cz