Databázový model výkladového slovníku

 

 

Doc. Ing. Jana Klečková, Ing. Roman Mouček, PhD.

ZČU v Plzni, Fakulta aplikovaných věd, Katedra informatiky

1Úvod

 

V průběhu uplynulých 15 let se na jihu Čech  utvořil kolektiv vědeckých pracovníků, zabývajících se problematikou dialektů na pozadí vztahu jazyka, lidové kultury a zákonitostí vývoje regionu. Jedním z výsledků jejich práce je i nářeční slovník Doudlebska, který je vytvořen v databázovém  prostředí MS Access.

Cílem naší práce byla analýza tohoto slovníku a posléze návrh nového konceptuálního schématu (struktury databáze) pro slovník obdobného typu, který by byl vytvořen v databázovém prostředí Oracle.

Provedením analýzy Slovníku Doudlebska se ve vytvořeném návrhu objevily některé nedostatky, které se snažíme odstranit.  Z pohledu informatika se jako hlavní nedostatek jeví použití databázového prostředí MS Access. Toto prostředí neposkytuje žádné prostředky k ochraně dat, například zavedením různých uživatelských rolí, neumožňuje sdílet data mezi více uživateli, nepodporuje řízení transakcí, apod. Dalším nedostatkem je samotný ERA model. Tento ukládá všechny informace o hesle v jedné tabulce, která má více než 80 atributů. Takto rozsáhlá tabulka je značně  nepřehledná a vyhledávání v ní je časově náročné.

Aby byl slovník co nejvíce využitelný, je třeba ho zpřístupnit co nejširší veřejnosti. K tomuto účelu je ideální prostředí internetu. Proto jsme se rozhodli vytvořit nový nářeční slovník Plzeňska jako internetovou aplikaci, jejíž databázovou vrstvu by tvořil databázový systém Oracle. Uvedená aplikace by umožňovala široké veřejnosti prohlížení slovníku a registrovaným lingvistickým odborníkům jeho doplňování a editaci. Aplikace bude také obsahovat administrační část, ve které může administrátor  registrovat nové uživatele a spravovat účty existujících uživatelů.

Protože existující obsah slovníku je uchováván ve velkém množství databázových souborů aplikace MS Access, bude v rámci projektu vytvořen  nástroj pro automatický import těchto dat do databázového systému Oracle.

 V budoucnu by bylo vhodné doplnit vytvořený slovník, jehož uspořádání je  výhradně  abecední,  o část obsahující hesla uspořádaná věcně. Také by bylo možné doplnit slovník o monografii Plzeňského kraje apod.

2Postup řešení

 

 

Problém:  Vytvoření takového databázového modelu výkladového slovníku, aby pokrýval libovolné kombinace lexikálních jednotek a odpovídajících výkladů

 

Řešení: viz E-R-A model (obr. )

 

Poznámky:

 

 

Poznámky k dalšímu zamyšlení:

 

·       plnění databáze daty – předpokládá se paralelní plnění studenty

        důsledek:

o      chyby – je třeba opravit odborníkem v dané oblasti

o      množství lokálních databází – zřejmě zásadnější problém – sesypání a verzování – velmi náchylné k „průšvihům“, možné řešení – webová aplikace, jedna databáze na serveru, poté plnění dat přes webové rozhraní, databáze nemusí být plněna pouze na cvičení předmětu DBH

·       zadávání synonym – hledání synonym – vytvoření „verze googlu

o      jednodušší verze – poměrně málo pracná

o      složitější verze – obrovský nárůst pracnosti řešení

 

3Závěr

 

V rámci projektu byl vytvořen E-R-A model databáze, byl proveden návrh hierarchie formulářů a návrh předpokládající převedení databáze z prostředí MS ACCESS na web (Oracle, MySQL).

Doufáme, že vytvořený slovník má díky způsobu zpracování a množství poskytovaných  funkcí  ambice stát se jedním z nejlepších nářečních slovníků na českém internetu.

·