DjVu/Vývoj DjVu v datech

Z Wikiknih

O existenci formátu DjVu jsem se prvně dozvěděl v r. 1999, během studií na MU v Brně. Nejstarší zachovaný dokument v tomto formátu (vlastní provenience) byl vytvořen během mých prvních pokusů r. 2003, tehdy ještě na platformě MS Windows aplikací DjVu Solo.

DjVu dokument verze 16, 17[editovat | editovat zdroj]

Vývoj DjVu formátu probíhal v AT&T Laboratories v letech 1996-1999. Balík nástrojů pro tvorbu DjVu souborů měl název 'DjVu Shop. Konverze se prováděla na příkazovém řádku, takže nebylo možné průběžně vizuálně kontrolovat výslednou kvalitu. Volba optimálních parametrů tak byla na zkušenostech a znalostech tvůrce DjVu dokumentů.

První beta verze aplikace DjVu Shop ukládala dokumenty ve verzi 16 a DjVu Shop 2.0 Beta2 ve verzi 17. V roce 1999 odkoupila práva na DjVu Shop od AT&T fa. LizardTech.

DjVu dokument verze 18[editovat | editovat zdroj]

Protože z uživatelského hlediska nebylo opakované zadávání konverzních parametrů moc praktické, rozšířila firma Lizardtech DjVu Shop o možnost využívat tzv. profil. Díky tomuto profilu nebylo nutné zadávat pro každou konverzi tyto parametry znovu, ale stačilo pro konverzi zvolit vhodný profil podle typu dokumentu. Tato první komerčně distribuovaná verze aplikace DjVu Shop 2.0.2 ukládala soubory jako DjVu dokument verze 18.

DjVu dokument verze 20[editovat | editovat zdroj]

Duben 1999

DjVu dokument verze 21[editovat | editovat zdroj]

Září 1999

Rozšíření specifikace[editovat | editovat zdroj]

Nový formát pro svázané dokumenty[editovat | editovat zdroj]

Aplikace DjVu Shop umožňovala i tvorbu vázaných DjVu dokumentů. A to buď konverzí dokumentů z bitmapových obrázků formátu BMP, GIF či JPG, nebo svázáním již hotových stránek v nativním DjVu formátu IW44. Problémem těchto svazků však bylo, že index svázaného dokumentu byl uchováván ve zvláštním souboru (djvudir.iff), bez kterého DjVu prohlížečka nebyla schopna s dokumentem pracovat jako se svazkem.

V původní specifikaci DjVu formátu, kterou uvolnila firma AT&T v dubnu r. 1999 však nebyla o svazcích žádná zmínka. Z toho lze soudit, že AT&T nepovažovalo stávající řešení vícestránkových svazků za konečné. LizardTech tedy změnil formát svazků a rozšířil stávající specifikaci formátu DjVu z 2.0 na 3.0.

U původního formátu svazků (který nebyl součástí specifikace DjVu) každá jednotlivá stránka svázaného dokumentu odkazovala na index (identifikovaný jako 'DIR0'). Prohlížečka tedy nepracovala s jedním kořenovým dokumentem, ale s každou stránkou samostatně. V případě, že byl index poškozen (nebo byl nedostupný) přestaly stránky fungovat jako svazek.

Nová specifikace vyřešila otázku svazků obráceně. Při prohlížení nepracuje prohlížečka rovnou s jednotlivými stránky svazku, ale s jedním kořenovým DjVu dokumentem, který obsahuje blok dat s indexem (indentifikovaný jako DIRM). Ten, podle typu svazku, obsahuje buď offsety na jednotlivé stránky nebo jména fyzických souborů, které jsou součástí svazku.

Sdílená obrazová data u svazků[editovat | editovat zdroj]

Formát svazků byl dále rozšířen o blok sdílených dat 'Djbz'. Tento blok obsahuje set zakomprimovaných vzorků (shapes), které se na jednotlivých stránkách svazku mohou opakovat. Vrstva 'Sjbz' jednotlivých stránek ve svazku tak nemusí obsahovat všechny vzorky, ale pouze ty, které nejsou součástí tohoto sdíleného bloku.

Skrytá textová vrstva[editovat | editovat zdroj]

S rozšířením formátu přišel LizardTech také s novými aplikacemi pro tvorbu DjVu dokumentů.

Aplikace[editovat | editovat zdroj]

DjVu Solo[editovat | editovat zdroj]

Aby firma podpořila rozšíření DjVu formátu, nabídla k osobnímu použití bezplatnou aplikaci DjVu Solo 3.0 (kterou později nahradila verzí DjVu Solo 3.1). Všechny verze aplikace DjVu Solo ukládají konvertované dokumenty jako DjVu dokument verze 21.

Aplikace DjVu Solo byla určená pouze pro platformu MS Windows a licenčním ujednáním bylo omezeno veřejné publikování vytvořených dokumentů prostřednictvím internetu.

Document Express[editovat | editovat zdroj]

Pro komerční účely a publikování DjVu dokumentů prostřednictvím internetu nabídla firma tři variace produktu pod názvem DocumentExpress[1]. První dvě variace Desktop a Proffesional byly z uživatelského hlediska velmi podobné. Lišily se především v tom, že lacinější verze Document Express Desktop umožňovala zpracovávat pouze jednostránkové dokumenty, kdežto Document Express Proffesional umožňoval pracovat se svazky.[2]

Variace Document Express Enterprise nebyla určena pro desktopové použití, ale pro nasazení na server. V této oblasti však Microsoft nedominoval, tak jako na desktopech, proto nebyla nabízena jen verze pro platformu MS Windows, ale do verze 5.1 i verze pro unix.[3]

DjVu dokument verze 22[editovat | editovat zdroj]

DocumentExpress verze 3.5 a 3.5.4 ukládal dokumenty ve formátu DjVu verze 22 (resp. 23). Od verze 3.6, kdy byla implementována další rozšíření formátu DjVu, pak jako DjVu verze 24.

  • Jak DjVu Solo, tak DocumentExpress umožňovaly při konverzi dokumentů do DjVu zvolit podle typu předlohy jeden ze čtyř přednastavených profilů - skenovaný dokument, barevná fotografie, černobílý dokument a indexovaný dokument.
  • Objevily se také náhledy
  • Svazky dokumentů bylo možné uložit buď jako pevný, nebo volný svazek.
  • Obě aplikace také umožňovaly tvorbu hyperlinků

Rozdíl mezi komerční aplikací DocumentExpress a aplikací DjVu Solo byl především v dalších opravných algoritmech, které LizzardTech implementoval pouze u svých komerčních produktů. Aplikace pomocí těchto algoritmů při konverzi používá optimální segmentaci barevných vrstev, což se projeví zvláště při zpracování dokumentů, které byly nějakým způsobem poškozené (resp. obsahovují strojopis, čárovou grafiku atd.). Při obdobné kvalitě zpracování tak lze u DjVu souboru téže stránky dosáhnout mnohem lepšího kompresního poměru.

Dalším rozšířením komerční aplikace byla virtuální tiskárna, která umožňovala přímý tisk do DjVu

OCR od verze 3.5 omezení pouze na latinku

4.1.0 - nové možnosti poznámek - bitmapa, čára základní geometrické obrazce, polygon, přišpendlená poznámka Prvně se objevily záložky

V roce 2004 se objevila verze 5.0 (zmizely poznámky neboť značně zpomalovaly čtení a zvětšovaly objem souboru) Byly zakoupeny práva na engine ReadIris a objevil se nový modul Enterprise Workflow Manager

také se objevil vodoznak. Umožňoval ho přidávat výlučně Workflow manager Editace profilů -scénáře

Rozdíl mezi virtuálním tiskem do djvu a konverzí postscriptu do Djvu

V roce 2005 se objevila verze 6.0 [4]

  • Možnost editace záložek
  • rozšířené možnosti hyperlinků
  • Znovu se objevila možnost měření, která sice byla již ve verzi 4, musela však být zapsána v souboru.

DocumentExpress verze 6.0 ukládá dokumenty následovně: Starší dokument do kterého se přidá nějaké rozšíření se uloží jako verze 26. Pokud je tento dokument editován znovu a tato rozšíření se odstraní, pak se uloží jako verze 25. je to kvůli tomu, že prohlížečka pak zbytečně neprovádí některé procesy.

SecureDjVu od verze 6.1 vydané v červnu 2007

Celartem - Caminova 2007-?[editovat | editovat zdroj]

Na konci roku 2007 koupila LizardTech japonská firma Celartem. Vedení této firmy pravděpodobně rozhodlo, že LizardTech bude do budoucna nabízet již pouze své produkty na základě formátu MrSid a tak přislíbené vydání aplikace Document Express Enterprise Edition 7.0 již proběhlo pod jejich vlajkou.

Zřejmě to však nebylo asi nejlepší řešení, neboť další vývoj a prodej produktové řady DocumentExpress převzala nově založená dceřinná společnost Celartemu založená r.2009 Caminova. Ta vydala r.2009 Document Express Editor verze 6.5 a v lednu 2010 vyšla i nová verze aplikace Document Express 7.5 Enterprise. Z hlediska funkcionality se však zdá, že žádný zásadní vývoj u těchto aplikací od r.2007 neproběhnul.

  1. Jen pro zajímavost zde uvádím jaké byly prodejní ceny těchto aplikací na jaře 2005:
    • Document Express Desktop 4.1 - $195
    • Document Express Professional 4.1 - $249
    • Document Express Enterprise 5.1 - $6500(!)
    Pozn.: v r. 2005 kurz koruny vůči dolaru poprvé v historii klesnul k hranici 22Kč/$1
    V současné době (podzim 2010) nabízí fa. Caminova tyto aplikace:
    • Document Express Desktop 6.5 - $39
    • Document Express Professional 6.5 - $149
    • Document Express Enterprise 7.5 - aktuální cenu se nepodařilo zatím zjistit
  2. V současné době obě variace vychází z původní verze Proffesional a jsou označovány jako DjVu Editor. Liší se tím, že variace Desktop neobsahuje OCR engine.
  3. Od verze 7.0 je však Document Express Enterprise díky vazbě na .NET a autorizační mechanismy MS svázan již výlučně s platformou MS Windows.
  4. verze 5.1 byla dodávaná ve dvou variacích Unlimited a Limited, která byla omezená na 25000 konverzí. DocumentExpress LizzardTech nikdy nenabídnul jako OEM, nebo jako Academic Edition.