U6 jsem to porůznu házel, jak jsem to psal, ale třeba někdo přišel později a některé z těch článků by se mu hodily:
http://www.pepak.net/e-books/html-jako-e-bookovy-format/
- Proč má smysl používat pro tvorbu e-knih formát HTML a ne ostatní. Základní myšlenka mého přístupu je, že všechno připravím v HTML určitého tvaru a následně mám připravené skripty, kterým knihu převedu do cílového formátu toho kterého zařízení. Ten formát přitom může být celkem libovolný, podle toho, co mám za zařízení a jaké formáty mu "chutnají". (Proč nepoužít třeba DOC: Protože HTML je textový formát, pro jehož úpravu jde použít stovky aplikací, kterými se dá řešit skoro každá myslitelná situace; nestane se, jako u Wordu, že budu vázán tím, co umí nebo neumí Word.)
http://www.pepak.net/e-books/h2lrf-hromadna-konverze-html/
- Tu hromadnou konverzi dělám tímhle svým nástrojem.
http://www.pepak.net/e-books/z-papiru-do-ctecky-5-technicka-korektura/
- Několik doporučení a üžitečných regulárních výrazů pro základní úpravu knih.
http://www.pepak.net/e-books/sablona-pro-e-knihu-v-html/
- Základní HTML kostra, do které upravuji svoje knihy, aby se s nimi potom snadno pracovalo.
http://www.pepak.net/e-books/vycisteni-html-knihy/
- Postupy (a spousty regulárních výrazů), kterými se z OCR FineReaderu dostanu do "mého" HTML. Ale je to použitelné i pro jiné vstupy než jen OCR z FineReaderu.
http://www.pepak.net/e-books/uvozovky-v-html/
- Speciálně jsem se zabýval problematikou uvozovek.
http://www.pepak.net/e-books/prevod-z-txtpdb-do-html/
- Pokud má někdo na vstupu čistý text a chce na výstupu dostat HTML...
http://www.pepak.net/programovani/regularni-vyrazy-1-uvod/
- Pro úpravu knih jsou regulární výrazy velmi užitečné. Bohužel většina tutorialů se zabývá jen úplně základními použitími regexpů a opomíjí spousty pokročilých (ale velmi užitečných) možností. Tady jsem se snažil popsat regexpy co nejúplněji.
http://www.pepak.net/e-books/tags-nastroj-pro-cisteni-html-knih/
- Nic mi nepije krev víc, než když mám v knize spousty zbytečných tagů. Tímhle nástrojem je kontroluji.
http://www.pepak.net/e-books/quotes-nastroj-pro-kontrolu-uvozovek/
- A tímhle kontroluji, že jsou v pořádku (správně ukončené, správně zanořené) uvozovky.
Pravda, má to celé jednu nevýhodu, že se člověk musí "hrabat v kódu". Ale zase tak složité to není, podařilo se mi to celkem uspokojivě naučit i moji matku - klíčem je využít nějaký programátorský editor, který dokáže zvýrazňovat syntaxi (takže jsou vidět chyby) a volat externí nástroje (takže se mu dá do menu vrazit volání Tags, Quotes a samozřejmě Xmllint).