Databázový model
výkladového slovníku
Doc.
Ing. Jana Klečková, Ing. Roman Mouček, PhD.
ZČU v Plzni, Fakulta aplikovaných věd, Katedra
informatiky
V průběhu uplynulých 15 let
se na jihu Čech utvořil kolektiv
vědeckých pracovníků, zabývajících se problematikou dialektů na pozadí vztahu
jazyka, lidové kultury a zákonitostí vývoje regionu. Jedním z výsledků jejich
práce je i nářeční slovník Doudlebska, který je
vytvořen v databázovém prostředí MS Access.
Cílem naší práce byla analýza
tohoto slovníku a posléze návrh nového konceptuálního schématu (struktury
databáze) pro slovník obdobného typu, který by byl vytvořen v databázovém
prostředí Oracle.
Provedením analýzy Slovníku Doudlebska se ve vytvořeném návrhu objevily některé
nedostatky, které se snažíme odstranit.
Z pohledu informatika se jako hlavní nedostatek jeví použití
databázového prostředí MS Access. Toto prostředí neposkytuje žádné prostředky
k ochraně dat, například zavedením různých uživatelských rolí, neumožňuje
sdílet data mezi více uživateli, nepodporuje řízení transakcí, apod. Dalším
nedostatkem je samotný ERA model. Tento ukládá všechny informace o hesle
v jedné tabulce, která má více než 80 atributů. Takto rozsáhlá tabulka je
značně nepřehledná a vyhledávání
v ní je časově náročné.
Aby byl slovník co nejvíce
využitelný, je třeba ho zpřístupnit co nejširší veřejnosti. K tomuto účelu
je ideální prostředí internetu. Proto jsme se rozhodli vytvořit nový nářeční
slovník Plzeňska jako internetovou aplikaci, jejíž databázovou vrstvu by tvořil
databázový systém Oracle. Uvedená aplikace by
umožňovala široké veřejnosti prohlížení slovníku a registrovaným lingvistickým
odborníkům jeho doplňování a editaci. Aplikace bude také obsahovat
administrační část, ve které může administrátor
registrovat nové uživatele a spravovat účty existujících uživatelů.
Protože existující obsah slovníku
je uchováván ve velkém množství databázových souborů aplikace MS Access, bude
v rámci projektu vytvořen nástroj
pro automatický import těchto dat do databázového systému Oracle.
V budoucnu by bylo vhodné doplnit
vytvořený slovník, jehož uspořádání je
výhradně abecední, o část obsahující hesla uspořádaná věcně.
Také by bylo možné doplnit slovník o monografii Plzeňského kraje apod.
Problém: Vytvoření takového databázového modelu
výkladového slovníku, aby pokrýval libovolné kombinace lexikálních jednotek a
odpovídajících výkladů
Řešení: viz E-R-A model
(obr. )
Poznámky:
Poznámky k dalšímu zamyšlení:
· plnění databáze daty
– předpokládá se paralelní plnění studenty
–
důsledek:
o chyby – je třeba opravit odborníkem v dané oblasti
o množství lokálních databází – zřejmě zásadnější problém –
sesypání a verzování – velmi náchylné k „průšvihům“,
možné řešení – webová aplikace, jedna databáze na serveru, poté plnění dat přes
webové rozhraní, databáze nemusí být plněna pouze na cvičení předmětu DBH
· zadávání synonym – hledání synonym – vytvoření „verze googlu“
o jednodušší verze – poměrně málo pracná
o složitější verze – obrovský nárůst pracnosti řešení
V rámci
projektu byl vytvořen E-R-A model databáze, byl proveden návrh hierarchie
formulářů a návrh předpokládající převedení databáze z prostředí MS ACCESS
na web (Oracle, MySQL).
Doufáme, že vytvořený slovník má
díky způsobu zpracování a množství poskytovaných funkcí
ambice stát se jedním z nejlepších nářečních slovníků na českém
internetu.
·