DjVu/DjVu - formát pro elektronickou archivaci dokumentů

Z Wikiknih
Skočit na navigaci Skočit na vyhledávání

Formát DjVu je podobně jako PDF určen pro elektronickou konzervaci dokumentů. Mezi jeho silné zbraně patří:

  • Komprimace obrazových vrstev wavelet kompresí - tím DjVu dosahuje dobrého poměru mezi čitelností dokumentu a celkovým objemem uložených dat.
  • Bezproblémové slučování a rozdělování jednotlivých stránek (dokumentů), přičemž každý dokument ba i každá extrahovaná vrstva může existovat jako samostatný dokument.
  • Obrazové a textové informace umístěné v oddělených vrstvách. Každá stránka DjVu dokumentu má svou vlastní editovatelnou textovou vrstvu, kterou lze fulltextově prohledávat a indexovat. Obsah do této vrstvy lze doplnit pomocí editačního nástroje djvused i dodatečně pomocí OCR rozpoznáním černobílé vrstvy.
  • Skrytá textová vrstva také může obsahovat řadu dalších informací, díky nimž lze vyloučit jakoukoliv dodatečnou úpravu originálního dokumentu.

Tyto vlastnosti přímo předurčují formát DjVu k archivaci tiskovin a listin, neboť umožňují naskenované dokumenty zredukovat na přijatelnou velikost, aniž by tím nějak výrazně utrpěla jejich čitelnost. U takto „zakonzervovaných“ dokumentů zůstává zachováno vše co bylo na originálu (např. nejrůznější vpisky, otisky atp.), a přitom s nimi lze dále pracovat. Skrytá textová vrstva navíc dává možnost doplnit indexovatelný obsah zvláště u dokumentů psaných rukopisem či znakovým písmem. Díky tomu je tento formát velmi výhodný pro publikování archivovaných materiálů prostřednictvím internetu.

Obsah
◄ Obálka DjVu - formát pro elektronickou archivaci dokumentů DjVu versus PDF ►