DjVuLibre

Z Wikiknih

Přejít na: navigace, hledání

V pravidelných intervalech se má pozornost vrací k formátu DJVU. Nevím nakolik vám tento formát něco říká, takže velmi zhruba řečeno:

  • Podobně jako PDF je určen pro elektronickou konzervaci dokumentů. Jednotlivé stránky lze spojovat, rozdělovat, vytahovat i vkládat
  • Pro komprimaci obrazových vrstev se používá wavelet komprese, čímž se dosahuje dobrého poměru mezi čitelností dokumentu a celkovým objemem uložených dat.
  • Stránky mohou mít editovatelnou textovou vrstvu, kterou lze fulltextově prohledávat a indexovat

Díky vlastnostem a možnostem tohoto formátu lze naskenované dokumenty (ale nejen ty) smrsknout do přijatelné velikosti aniž by tím utrpěla jejich čitelnost i při několikanásobném zvětšení, takže u takto "konzervovaných" dokumentů zůstávají zachovány i drobné detaily, s nimiž lze dále pracovat. To jen tak na úvod...

Obsah

[editovat] Jak vypadá dokument ve formátu DJVU?

Základem je stránka, která má několik vrstev tzv. "chunks". Jednotlivé stránky lze spojovat do jednoho celku - "svazku" (bundle) pomocí aplikace djvm . V případě rozsáhlejších dokumentů umožňuje djvu formát také volnější spojení svazku (indirect), kdy jsou stránky uloženy v jediném společném adresáři a svázány jedním indexovým djvu souborem.

Převod mezi "bundle" a "indirect" lze bez problémů provádět pomocí djvmcvt . Výhodou spojených stránek je mimo jiné možnost používat interní hypertextové odkazy, podobně jako tomu je u PDF, generovat náhledy, atd.

[editovat] Struktura dokumentu

Výpisu struktury pomocí djvudump se liší podle toho, zda je dokument typu "bundled" nebo "indirect". Protože v "bundled" svazku jsou přítomny zároveň všechny stránky, není problém vypsat také informace o vrstvách které obsahují. To však neplatí v případě že je dokument typu "indirect". Příklad téhož dokumentu ve formě:


"indirect"

  FORM:DJVM [136]
    DIRM [78]         Document directory (indirect, 3 files 2 pages)
      p0001.djvu -> p0001.djvu
      shared_anno.iff -> shared_anno.iff
      p0002.djvu -> p0002.djvu
    NAVM [38]

"bundle"

  FORM:DJVM [84467]
    DIRM [90]         Document directory (bundled, 3 files 2 pages)
    NAVM [38]
    FORM:DJVU [51805] {p0001.djvu}
      INFO [10]         DjVu 4960x7016, v24, 600 dpi, gamma=2,2
      INCL [15]         Indirection chunk --> {shared_anno.iff}
      Sjbz [28088]      JB2 bilevel data
      FGbz [5681]       JB2 colors data
      BG44 [4822]       IW4 data #1, 72 slices, v1.2 (color), 1654x2339
      BG44 [2683]       IW4 data #2, 11 slices
      BG44 [3939]       IW4 data #3, 10 slices
      BG44 [6399]       IW4 data #4, 10 slices
      TXTz [7]          Hidden text (text, etc.)
      ANTz [71]         Page annotation (hyperlinks, etc.)
    FORM:DJVI [65] {shared_anno.iff}
      ANTz [53]         Page annotation (hyperlinks, etc.)
    FORM:DJVU [32423] {p0002.djvu}
      INFO [10]         DjVu 4960x7016, v24, 600 dpi, gamma=2,2
      INCL [15]         Indirection chunk --> {shared_anno.iff}
      Sjbz [15651]      JB2 bilevel data
      FGbz [497]        JB2 colors data
      BG44 [4836]       IW4 data #1, 72 slices, v1.2 (color), 1654x2339
      BG44 [2326]       IW4 data #2, 11 slices
      BG44 [3202]       IW4 data #3, 10 slices
      BG44 [5719]       IW4 data #4, 10 slices
      ANTz [72]         Page annotation (hyperlinks, etc.)
      TXTz [7]          Hidden text (text, etc.)

Kromě stránek s obrazovou informací může obsahovat DjVu dokument také další stránky. Každá z nich je určena parametrem FORM. Podle jejich kodu můžete poznat jakou informaci obsahují

DJVM 
je indexovací stránka, která obsahuje dva bloky informací
DIRM 
obsahuje informaci zda je dokument svázaný či ne a které stránky do něj náleží
NAVM 
je textový blok, který se vyskytuje v případě že dokument obsahuje textový rejstřík (outline) ale nějak jsem nepochopil že se vypisuje pouze je-li dokument "bundled"
THUM 
vyskytuje se pouze v případě, že jsou v dokumentu předem vygenerovány náhledy. Ty mohou být jak pro každou stránku zvlášt, tak i najednou ve více vrstvách TH44 v rámci jedné stránky tohoto typu. Při převedení "bundle" dokumentu na "indirect" mají tyto stránky příponu "thumb".
DJVI 
jsou stránky s informacemi společnými pro celý dokument. Při převedení "bundle" dokumentu na "indirect" mají tyto stránky příponu "iff". Djvulibre podporuje momentálně pouze jediný list tohoto typu - "shared_anno.iff" která by měla soustředovat informace společné pro celý svazek, ale lze se setkat i s listy "docmeta.iff" a "pagemeta.iff". S těmi pracuje komerční software JRAPublish z http://www.planetdjvu.com Ty obsahují vrstvu typu JRMD (djvulibre využívá vrstvu ANTz) a podle http://www.planetdjvu.com/metadata_storage_for_djvu_files_m.htm by měly obsahovat následující meta klíče:
docmeta.iff - Title, Author, Date, Subject, Summary, Publisher
pagemeta.iff - Author, Date, Subject, Publisher
Vrstvy JRMD které jsou součástí jednotlivých stránek by pak měly obsahovat meta klíče - Title a Summary
DJVU 
je vlastní stránka s obrazovou informací, která může kromě obrazových vrstev obsahovat také skryté textové vrstvy s textovým obsahem stránky, meta informacemi, hyperlinky, atd..

[editovat] Vrstvy DJVU dokumentu

Základní informace o djvu dokumentu (kolik má stránek, vrstev, atp.) lze získat mj. utilitou djvudump. Obrazové vrstvy (chunks) lze extrahovat pomocí nástroje djvuextract, ovšem POZOR nikdy z nich nezískáte soubory identické s těmi ze kterých byly vytvořeny, protože použitá komprese je ztrátová. Vytažené vrstvy však můžete použít do jiných dokumentů (např jako "vodoznak" atp.), anebo z nich vyrenderovat bitmapový obrázek a dále pracovat s ním.

  • Identifikace použité komprese v označení obrazové vrstvy
  • bz - černobílá vrstva komprimovaná JB2
  • 44 - vrstva komprimovaná IW44
  • jp - vrstva komprimovaná JPEG
  • 2k - vrstva komprimovaná JPEG-2000
  • mmr - černobílá vrstva komprimovaná G4

Kompresní technika IW44 je založena na wavelet kompresi. Ta funguje tak, že se obrázek nejprve zredukuje na celistvé barevné plochy, a uložena je informace o křivkách, které vymezují každou tuto plochu, včetně jejich barevných hodnot. Oproti klasické bitmapové kompresi je výhodou že lze pak takový obrázek zvětšovat, aniž by se z něj stala změť barevných čtverečků. Čím celistvější barevná plocha, tím lepší komprese. Proto kompresní nástroj c44 nejprve aplikuje filtry, jimiž "rozhodí" barevné plošky do několika transparentních vrstev a ty pak komprimuje zvlášť. Výsledkem je jeden IW44 soubor s několika dílčími vrstvami ("slices"). Jde především o technologii ke kompresi fotografií, barevných obrázků a obrázků v odstínech šedi.

JB2 funguje na stejném principu jako IW44, ovšem vychází z toho, že předloha je pouze černobílá. Tudíž při kompresi již neřeší nějaké filtrování barev, ale úroveň redukce šumu. Ten tvoří různé drobné artefakty, vzniklé nečistotami ev. mechanickou strukturou skenovaného dokumentu, které nešlo odstranit nastavením parametrů při skenování.

  • INFO - je informační vrstva která obsahuje údaje o výchozím bitmapovém obrázku, jaké měl rozměry, rozlišení, barevnou hloubku a nastavení gammy.
  • INCL - je virtuální vrstva která obsahuje odkaz na shared_anno.iff hlavičku a patičku dokumentu.
  • Maska Sjbz - je vrstva která funguje jako maska pro popředí. V případě, že je zvolen při prohlížení černobílý režim, nahrazuje chybějící barevné vrstvy. Může jí být obrázek zkomprimovaný nástrojem cjb2 ale také celý djvu dokument, je-li pouze černobílý. Význam to má zvláště u starších tištěných dokumentů, kde díky tomu lze dosáhnout příznivé komprese celého djvu dokumentu. Zažloutlé pozadí stránek je odmaskováno do pozadí a písmo vhodným kontrastem vytažené do popředí. Maska může být také identifikována Smmr - je-li komprimovaná technologií MMR/G4, kterou používá TIFF.
  • BG - vrstvy pozadí - Obvykle jich je víc než jedna, ovšem extrahovat jsou pouze jako jeden celek.
  • FG - vrstvy popředí - tvoří primárně černobílá vrstva a vrstvy obsahující grafiku s indexovanými barvami. Při "manuální" tvorbě dokumentu můžeme zadanými parametry ovlivnit, které barvy budou součástí popředí a které již spadnou do pozadí.
  • TH - je vrstva s náhledy stránek vložených v dokumentu.
  • TXTz - je textová vrstva dokumentu s vlastním textovým obsahem stránky.
  • ANTz - je textová vrstva dokumentu, určená pro poznámky, bookmarky, hypertextové odkazy atp.
  • JRMD - je textová vrstva dokumentu, určená pro poznámky, bookmarky, hypertextové odkazy atp.
  • CIDa - je vrstva kterou podle mnou nalezených informací generuje Virtual Print Driver (zřejmě přímo od Lizzardu) a je součástí DjVu cca od verze djvu3.6.1
  • Djbz - je textová vrstva dokumentu, kterou lze upravovat pomocí dalších nástrojů.

[editovat] Jak vytvořit dokument ve formátu DJVU

Aby bylo možno s dokumenty v djvu pracovat, je nutné mít v systému nainstalované příslušné knihovny a nástroje - distribuční balíky mají obvykle v názvu "djvu", ale kdo chce, tak si je může zkompilovat sám. V případě aplikace gsdjvu , kterou využívá djvudigital to je dokonce nutnost.

[editovat] Konzervace psaného či tištěného dokumentu

Pokud chceme zpracovat do djvu klasický papírový dokument, tak jej musíme nejprve naskenovat. Už přitom musíme mít na paměti, že v případě djvu platí - čím kvalitnější výchozí předloha, vyšší použité rozlišení při skenování a celistvější barevné plochy v rámci dokumentu, tím kvalitnější (a menší) výsledný dokument. Nalézt optimální hodnoty nemusí být jednoduché, zvláště v případě že zpracováváme dokumenty hodně barevné. Záleží pak hodně na zkušenosti zpracovatele.

Naskenovaný dokument pak můžeme zpracovat přes OCR a výsledek vložit do djvu stránky jako textovou vrstu - umožní to pak fulltextové prohledávání dokumentu.

Naskenovanou stránku podle typu zpracujeme příslušným enkoderem (na barevný obrázek použijeme c44 na černobílý cjb2 .

[editovat] Konzervace elektronického dokumentu

Pokud si kladete otázku jaký má smysl převádět do DJVU např. webovou stránku, tak mohu nabídnout několik odpovědí.

  • Podobně jako PDF uchová DJVU včetně jejího grafického vzhledu - je to v podstatě obrázek.
  • Navíc je možné do dokumentu natlačit i textovou vrstvu, kterou lze fulltextově prohledávat a v případě potřeby vytáhnout a použít pro kompilaci jiného textu.
  • Podobně jako PDF lze DJVU dokumenty spojovat do svazků a rozšiřovat o náhledy a hypertextové odkazy.
  • Na rozdíl od PDF je-li DJVU dokument otevíraný skrz URL, není nutno čekat na stažení všech stránek, ale stránky se načítají průběžně. Navíc, pokud má webserver pro HTTP/1.1 protokol volbu "byte serving" a podporuje ji také váš prohlížeč a nejrůznější proxy mezi vámi a serverem, tak lze přejít i na další stránky aniž by bylo nutno čekat až přijde řada na jejich stažení - browser si o ně řekně přednostně.

Asi nejjednodušším způsobem jak získat z elektronického dokumentu dokument djvu je použití aplikace djvudigital, ta však vyžaduje aby bylo v systému nainstalováno ghostscriptové rozšíření gsdjvu které bohužel nemá GPL licenci, tudíž není součástí distribučních balíků. Ovšem lze je bez problému stáhnout z CVS archívu a zkompilovat zvlášť.

Výchozí dokument pak vytiskneme do postscriptového či PDF souboru a ten pak převedeme do djvu

[editovat] Tipy

Tyto informace jsem zachytil v diskuzích..

[editovat] Převod JPEG obrázku ve stupních šedi

Příklad

user@stroj:~$ c44 -crcbnone -percent 10,20,35,50 foo.jpg foo.djvu

"Nejlepšího výsledku při konverzi z jpeg do c44 dosáhnete při zmenšení na poloviční velikost. Sníží se tím počet artefaktů"

"Je-li obrázek příliš tmavý lze upravit jeho jas nastavením gammy"

[editovat] Výpis metainformací z DjVu dokumentu

Příklad

user@stroj:~$ djvused 01.djvu -e 'select 1 ; print-meta'

[editovat] Použití masky pro skenované stránky

Příklad

user@stroj:~$ jpegtopnm sken.jpg | tee sken.pnm | ppmtopgm | pgmtopbm -threshold -value 0.6 - > maska.pbm
user@stroj:~$ cjb2 maska.pbm maska.djvu
user@stroj:~$ djvumake sken.djvu Sjbz=maska.djvu PPM=sken.pnm

Při použití masky u naskenovaných dokumentů lze razantně zmenšit velikost výsledného djvu dokumentu oproti komprimaci pouze pomocí c44!

[editovat] Manipulace se stránkami DJVU dokumentu

Pro manipulaci se stránkami se používá djvm. Umožnuje vkládat stránky (i celé dokumenty), mazat vložené stránky

[editovat] Jak zpracovávat textovou vrstvu

Práce s textem v djvu dokumentech mi přišla poněkud nepohodlná, je to ale do značné míry dáno tím, že prozatím neexistuje žádné GUI, které by to usnadnilo vizuální orientaci při editaci textu. Možná by bylo řešením dopsat plugin do aplikace Scribus, nebo rozšířit možnosti djview. Nicméně práce na příkazové řádce je docela použitelná a efektivní - pokud člověk ví co a jak.

Textová vrstva pracuje se třemi typy textových informací Hidden text Annotation


Při vypsání textu přes djvused se můžete setkat s těmito prvky:

page 
je přítomen vždy a vymezuje obsah stránky
column 
sloupec - vyskytuje se v dokumentech co mají text stránek uspořádaný do sloupců
region 
oblast?
para 
odstavec
line 
řádek
word 
nejmenší prvek obsahující samotný text

Souřadnice - Každý z těchto prvků má uvedeny souřadnice levého horního rohua a pravého dolního rohu, jimiž je vymezena jeho pozice vůči stránce. V případě že je obsažen pouze jediný prvek přebírá nadřazený prvek souřadnice podřízeného prvku. Jinak platí že:

leftmin - nejnižší leftmin ze všech podřízených prvků

topmin - nejnižší topmin ze všech podřízených prvků

leftmax - nejvyšší ze všech podřízených prvků

topmax - nejvyšší ze všech podřízených prvků

[editovat] Hypertextové odkazy

Odkazem hypertextových odkazů v DjVu dokumentu nemusí být nutně URL ale lze použít také skok na stránku v rámci dokumentu podle jejího pořadového čísla např. "#2" nebo jména dokumentu "p001_002.djvu" eventuálně vloženého titulku stránky (tu už ale vařím z vody).

Příklad:

(maparea "http://www.neco.cz" "Text co se zobrazí v bublině" (rect 225 0 804 61) (xor))

alternativně lze použít

(maparea (url "http://www.neco.cz" "_blank") "Odkaz bude otevřený do nového okna prohlížeče" (rect 225 0 804 61) (xor))

[editovat] Metadata

Metadata mohou obsahovat bud jednotlivé stránky DjVu dokumentu nebo celý dokument a jsou součástí skryté textové vrstvy s poznámkami (annotations). Lze je tedy vložit dvěma způsoby. Bud pomocí volby set-ant nebo set-meta V prvém případě je třeba použít plný zápis. Syntaxe je jednoduchá. Klíčovým slovem může být jakékoliv slovo bez mezer a diakritiky. djvused vám sice umožní klíčové slovo s diakritikou vložit, ale djview vám potom odmítne s meta informacemi dále pracovat.

Obsah klíče je oddělen od klíčového slova mezerou a je uzavřen do uvozovek

Příklad syntaxe pro vložení přes set-meta:

klic "Text co se zobrazí pokud umožňuje prohlížeč djvu dokumentů pracovat s metatagy"

Příklad syntaxe pro vložení přes set-ant:

(metadata 
   (klic "Text co se zobrazí pokud umožňuje prohlížeč djvu dokumentů pracovat s metatagy") )

[editovat] Hlavička a patička stránky

Nastavení hlavičky a patičky se vkládá jako poznámka (set-ant) do shared_anno.iff (select-shared-ant). Jejich tisk je však záležitostí prohlížeče DjVu souborů, zda je do tisku pošle či nikoliv. Jinde totiž než na vytištěném dokumentu záhlaví a patička vidět není. Pokud vím tak ani žádná prohlížečka krom produktu Lizardtechu tento prvek při tisku zatím nepoužívá.

Klíčová slova

phead - hlavička
pfoot - patička

Zajímavé je, že lze do nich vkládat proměnné - bohužel, nevydedukoval jsem nic než že..

proměnnou je nahrazeno místo v uvozovkách..
je úplně putna jestli se do uvozovek napíše date, time, page.. vždy totiž nahradí..
obsah pravého horního rohu - číslem stránky / celkový počet stránek
obsah levého dolního rohu - názvem tištěné stránky dokumentu
obsah pravého dolního rohu - aktuálním datem
nelze kombinovat text a proměnnou v takových případech se zobrazí pouze text

Příklad použití:

(phead "left::Text v levém rohu" "right::Text v pravém rohu" )
(pfoot "left::Text v levém dolním rohu. Napravo se zobrazí aktuální datum" "right::" date"" )

[editovat] Rejstřík

[editovat] Syntaxe pro djvused

set remove output print
meta x x - x
page-title x - - -
outline x x - -
thumbnails x x - -
ant x x x x
txt x x x x
ls vypíše seznam všech stránek
n vypíše celkový počet stránek v dokumentu
dump vypíše dekomprimovaný obsah IFF souboru (stejný efekt jako má utilita djvudump)
size vypíše jaké jsou rozměry vybrané stránky v pixlech. Není-li vybraná žádná stránka vypíš postupně tento údaj pro všechny
select <id> vybere stránku podle jejího id (číslo v prvním sloupci výpisu příkazu ls). Není-li uvedeno žádné id vybere kořen dokumentu
select-shared-ant vybere stránku pro skryté poznámky
showsel vypíše informaci o aktuálně vybrané stránce


ant txt meta outline thumbnails

Akce print output set remove

Zvláštní kombinace: print-pure-txt print-merged-ant output-all


Rozbalovací menu - outline/bookmarks - (bookmarks ("První stránka" "#1") ("Druhá stránka" "#2"))

[editovat] Nástroje pro práci s DJVU

[editovat] Prohlížečky DjVu dokumentů

[editovat] Podpora prvků DjVu dokumentů

Djview (3.0) Djview (4.0) WinDjview 4.2.0 JavaDjVu 8.09 DjVu Browse plug-in 5.0.2 build 881 DjVu Browse plug-in 6.1.0 build 1492
Metainformace ne ano ne ne ne ne
Náhledy ano ano ano anoŠablona:Rec ano ano
Rejstřík ne ano ano anoŠablona:Rec ano ano
Rozšířená navigace ne ne  ? ano ne ne
Zobrazování alternativního textu ano ano ano ne ano ano
oval oválné ohraničení oblasti ano ano neŠablona:Rec ne ano ano
rect obdélníkové ohraničení oblasti ano ano ano ano ano ano
xor čárkovaný okraj ne ano ne ne ne ne
shadow_in stínovaný okraj oblasti ne ano ne ne ano ano
border viditelný okraj oblasti ano ano ano ano ano ano
border_avis ano ne  ?  ?  ?  ?
pushpin vložená poznámka ne anoŠablona:Rec ne ano ne ano
line linka ne ano ne ano ne ano
arrow šipka na konci linky ne ano ne ano ne ano
none ne ano ne  ? ne ne
phead záhlaví dokumentu  ?  ?  ? ne ano ano
pfoot zápatí dokumentu  ?  ?  ? ne ano ano

[editovat] Djview

Open source prohlížečka DjVu dokumentů, která je součástí projektu DjVuLibre. V současné době pracuje Léon Bottou na nové verzi založené na Qt4, která doplňuje řadu věcí co ve stávající distribuční verzi (Qt3) schází. Např. podporu pro rejstřík, zvýrazněné oblasti, oválné hyperlinky, zobrazování metainformací, atd. V současné době jde asi o nejlepší čtečku djvu souborů.

Djview 3.0 (distribuční) 
se již nevyvíjí, nahradil jej Djview 4.0
Plusy
- snadná integrace do systému
Mínusy
- hyperlinky zobrazuje pouze jako typ rect
- nezobrazuje metainformace
Djview 4.0 (vývojový) 
je součástí distribuce DjVulibre 3.5-20
Plusy
- funguje zobrazování metainformací jak pro dokument, tak jednotlivé listy
- zobrazuje rejstříky a náhledy
- fungují vložené poznámky
- fungují všechny typy hyperlinků (typ polygon jsem nezkoušel )
- fungují vložené šipky
Mínusy
- nefunkční tisk (může být problém mojí distribuce)
- pracuje vždy s jedním dokumentem, tzn. při otevření nového dokumentu předchozí uzavře

[editovat] WinDjview

http://windjview.sourceforge.net/

Je open source prohlížečka DjVu dokumentů pro MS-Windows, kterou vyvíjí Андрей Жежерун (čti: andrej žežerun). Pro renderování stránek používá stejně jako Djview' knihovnu DjVuLibre. Kromě této čtečky lze nalézt na tomto webu také nástroj pro tvorbu rejstříku pro MS-Windows,

WinDjView 0.4.2 
Plusy
- funguje bez problémů také pod wine
Mínusy
- hyperlinky zobrazuje pouze jako typ rect
- nezobrazuje metainformace

[editovat] Java DjVu Viewer

http://sourceforge.net/projects/javadjvu/

Prohlížečka DJVU dokumentů naprogramovaná v Javě, tím pádem je multiplatformí - použít ji lze všude kde je nainstalovaná Java.

Subjektivní hodnocení: pomalé renderování dokumentů, žádný dialog s bližšími informacemi o stránkách ve svázaném dokumentu. Na druhou stranu podpora outline (bookmarků), a trochu jiná práce s textem (pro výběr textu se hlavní okno přepne do modu, který vypíše podobný výstup jako djvutxt z DjVuLibre.

[editovat] Nástroje pro úpravu DjVu dokumentů

[editovat] DjVuSolo

Nástroj pouze pro MS-Windows. Umožňuje vytvářet hyperlinky v grafickém prostředí, generovat náhledy stránek, spojovat a rozdělovat DjVu dokumenty

DjVu Solo 3.1 
již se nevyvíjí, nahrazuje jej sada nástrojů DjVu Document Express
Plusy
- funguje bez problémů také pod wine
Mínusy
- neumožňuje práci s textovými vrstvami - hledání textu, atp.
- nepracuje s metainformacemi
- nezobrazuje rejstřík

[editovat] DjVu Document Express

http://www.lizardtech.com/

Je komerční sada nástrojů společnosti LizardTech. Její součástí je editor DjVu dokumentů který nahradil DjVuSolo. Má sice omezené možnosti editace zdrojového textu - umožňuje na něj pouze pasivně aplikovat OCR, umožňuje ale práci s poznámkami, metainformacemi a hyperlinky.

Document Express Editor 5.0.0 build 16 
již je sice zastaralý, bohužel novější verzi se mi nepodařilo nainstalovat, byť má jít o trial.
Plusy
- funguje bez problémů také pod WINE
- lze pracovat také s hyperlinky typu polygon
- Pro OCR lze nastavit použitý jazyk a funguje docela dobře
Mínusy
- neumožňuje hledání v textu
- nepracuje s metainformacemi
- OCR je možné aplikovat pouze na celou stránku

[editovat] DjVuLibre

http://djvulibre.djvuzone.org/

Opensource aplikace a knihovny pro práci s DjVu dokumenty. Součástí je prohlížeč DjVu dokumentů djview naprogramovaný v C a s rozhraním v Qt. V současné době je to asi nejlepší prohlížečka DjVu dokumentů. Balík DjVuLibre obsahuje následující utility:

any2djvu skript pro konverzi dokumentů do DjVu skrze server
bzz kompresní utilita pro DjVu soubory
cjb2 enkodér pro černobílé soubory (text)
cpaldjvu enkodér pro obrázky s omezenou barevnou paletou (kresby)
csepdjvu nástroj pro tvorbu DjVu souboru ze surových dat
c44 enkodér pro barevné soubory (fotky)
ddjvu dekodér DjVu souborů
djvm nástroj pro manipulaci s obsahem DjVu souborů
djvmcvt nástroj pro práci s DjVu svazky
djvudigital utilita pro konverzi postsciptových souborů do DjVu (vyžaduje speciální ovladač pro ghostscript!)
djvudump nástroj pro výpis struktury DjVu souboru
djvuextract nástroj pro extrakci jednotlivých vrstev z DjVu souboru
djvumake nástroj pro tvorbu DjVu souboru slučováním jednotlivých vrstev
djvups nástroj pro konverzi DjVu do postscriptu (pro tisk)
djvused nástroj pro práci s textovou vrstvou DjVu souboru
djvutoxml pro export textové vrstvy do DjVuXML
djvutxt zjednodušená nadstavba pro djvused, pro export holého textu
djvuxmlparser nástroj pro import DjVuXML (pozor nezvládá všechny elementy!)

[editovat] Okular

Opensource nadstavba pro djvulibre, která je součástí KDE4 (Qt4). Lze s ní prohlížet i PDF dokumenty. Umožňuje vkládání poznámek, bohužel nikoliv přímo do djvu dokumentu, ale pouze do externího lokálně uloženého XML souboru.

[editovat] Evince

Opensource GTK nadstavba pro djvulibre, Lze s ní prohlížet i PDF dokumenty. Mívá u djvu problém s hyperlinky

[editovat] JRAPublish

http://www.planetdjvu.com/

Je komerční sada nástrojů společnosti LizardTech. Umožňuje aplikovat OCR, práci s poznámkami, metainformacemi a hyperlinky.

JRAPublisher 
neexistuje trial a pro svou činnost vyžaduje licenční hardwarový klíč
Plusy
Mínusy
- nefunguje pod WINE
- vyžaduje nainstalovanou Javu
- Převod do OCR byl nevalné kvality, jako OCR engine vyžaduje verzi Abbyy Finereader 7.0