• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    JYRKAElektronické knihy - tvorba a příprava
    PEPAK
    PEPAK --- ---
    U6 jsem to porůznu házel, jak jsem to psal, ale třeba někdo přišel později a některé z těch článků by se mu hodily:

    http://www.pepak.net/e-books/html-jako-e-bookovy-format/
    - Proč má smysl používat pro tvorbu e-knih formát HTML a ne ostatní. Základní myšlenka mého přístupu je, že všechno připravím v HTML určitého tvaru a následně mám připravené skripty, kterým knihu převedu do cílového formátu toho kterého zařízení. Ten formát přitom může být celkem libovolný, podle toho, co mám za zařízení a jaké formáty mu "chutnají". (Proč nepoužít třeba DOC: Protože HTML je textový formát, pro jehož úpravu jde použít stovky aplikací, kterými se dá řešit skoro každá myslitelná situace; nestane se, jako u Wordu, že budu vázán tím, co umí nebo neumí Word.)

    http://www.pepak.net/e-books/h2lrf-hromadna-konverze-html/
    - Tu hromadnou konverzi dělám tímhle svým nástrojem.

    http://www.pepak.net/e-books/z-papiru-do-ctecky-5-technicka-korektura/
    - Několik doporučení a üžitečných regulárních výrazů pro základní úpravu knih.

    http://www.pepak.net/e-books/sablona-pro-e-knihu-v-html/
    - Základní HTML kostra, do které upravuji svoje knihy, aby se s nimi potom snadno pracovalo.

    http://www.pepak.net/e-books/vycisteni-html-knihy/
    - Postupy (a spousty regulárních výrazů), kterými se z OCR FineReaderu dostanu do "mého" HTML. Ale je to použitelné i pro jiné vstupy než jen OCR z FineReaderu.

    http://www.pepak.net/e-books/uvozovky-v-html/
    - Speciálně jsem se zabýval problematikou uvozovek.

    http://www.pepak.net/e-books/prevod-z-txtpdb-do-html/
    - Pokud má někdo na vstupu čistý text a chce na výstupu dostat HTML...

    http://www.pepak.net/programovani/regularni-vyrazy-1-uvod/
    - Pro úpravu knih jsou regulární výrazy velmi užitečné. Bohužel většina tutorialů se zabývá jen úplně základními použitími regexpů a opomíjí spousty pokročilých (ale velmi užitečných) možností. Tady jsem se snažil popsat regexpy co nejúplněji.

    http://www.pepak.net/e-books/tags-nastroj-pro-cisteni-html-knih/
    - Nic mi nepije krev víc, než když mám v knize spousty zbytečných tagů. Tímhle nástrojem je kontroluji.

    http://www.pepak.net/e-books/quotes-nastroj-pro-kontrolu-uvozovek/
    - A tímhle kontroluji, že jsou v pořádku (správně ukončené, správně zanořené) uvozovky.

    Pravda, má to celé jednu nevýhodu, že se člověk musí "hrabat v kódu". Ale zase tak složité to není, podařilo se mi to celkem uspokojivě naučit i moji matku - klíčem je využít nějaký programátorský editor, který dokáže zvýrazňovat syntaxi (takže jsou vidět chyby) a volat externí nástroje (takže se mu dá do menu vrazit volání Tags, Quotes a samozřejmě Xmllint).
    ERGOSUM
    ERGOSUM --- ---
    GIF_242: Dalo by se říct, že e-knihu tady děláme komplet mnozí. S tou konverzí se to má tak: Pokud neskenuješ a neděláš OCR, začínáš s textem, následuje typografie a prepres, kde ty stránky zkulturníš, na to jsou i na nyxu jiné diskuse. A tady začne ta specifika e-knih. Tam, kde se u papíru řeší tisk, my to musíme dostat do čtečky, ne všechno ti čtečka umožní zobrazit, něco neumí ten který formát, sazba se mění podle nastavení uživatele a něco prostě neumíme. A tohle tady často řešíme. Tedy, aby text, kterému jsme dali nějakou úpravu, ji měl i ve čtečce. Pokud by nám nezáleželo na vzhledu, stačilo by alespoň v epub zmáčknout tlačítko pluginu.

    ADD sázecí programy: Pro výstup do PDF, PS, tisk, SVG, používám kde je třeba Scribus. Formáty pro čtečky však nedokáží ani plně využít to, co nabízejí textové editory.
    JYRKA
    JYRKA --- ---
    PISHPUNTA: Podle meho je to podstatne. Navic tady nejsou jen Kindlisti s kvalitnim zrakem.
    Proste PDF v teto podobe neplanujeme, sorry.
    PISHPUNTA
    PISHPUNTA --- ---
    K tvorbě PDF pro čtečky - osvědčil se mi rozměr 89 x 116 mm a kvůli Kindlu, protože centruje stránky i vertikálně, dát do záklaví a zápatí téměř neviditelné značky označující začátek a konec stránky.
    PISHPUNTA
    PISHPUNTA --- ---
    JYRKA: A myslíš, že změna velikosti písma je tak podstatná? Když je velikost písma v PDF pro čtečku vhodně zvolena a koreponduje s velikostí písma u tištěné knihy? Naopak získáváš kvalitní formátování. Podle mě by nebylo na škodu nabízet i PDF pro čtečky, vedle ePUB a MOBI.
    JYRKA
    JYRKA --- ---
    MR_MITCH: Ony ty knihy v tom InDesignu už jsou. Takže přes to nejede vlak.
    MR_MITCH
    MR_MITCH --- ---
    JYRKA: no jasně, místo InDesignu bych použil LaTeX :) Ale uznávám, že sehnat grafika, co umí InDesign je asi řádově snazší, než sehnat TeXistu.
    PEPAK
    PEPAK --- ---
    GIF_242: Protože existuje několik vzájemně neslučitelných požadavků na to, jak se má s knihou pracovat, a každý formát akcentuje jiný pohled. EPUB například jde cestou maximální kompatibility, ale předpokládá, že vykreslovací zařízení je dostatečně výkonné, aby dokázalo celou knihu v reálném čase přepočítat podle aktuálních nastavení (velikost písma apod.). MOBI naproti tomu zavádí určitá opatření, která likvidují tu plnou kompatibilitu, ale zase zmenšují nároky na zařízení.
    JYRKA
    JYRKA --- ---
    MR_MITCH: Až to bude, tak se strašně rád kouknu. Ještě malý podotek: ebook je v současnosti jen sekundární produkt, tak mysli i na vstup dat - není ekonomické celou knihu sázet z nuly, ale ideální je vyjít z toho proklínaného indesignu
    MR_MITCH
    MR_MITCH --- ---
    JYRKA: co TeX? minimálně pro odbornou literaturu.
    GIF_242: já teďka dělám nějaký makra a skripty v LaTeXu a lua, z jednoho zdroje mám PDF, html, odt, epub a mobi. teda budu mít až to bude fungovat.
    je to určený hlavně pro odbornou literaturu - grafika a matematika v svg nebo png, poznámky pod čarou, real page numbers apod.
    GIF_242
    GIF_242 --- ---
    GALENIUS: to vím, ale je to přesně o tom, jak píše JYRKA:


    no zatím je to pěkně začarovaný kruh :D
    JYRKA
    JYRKA --- ---
    GALENIUS: protože se ztrácí výhoda elektronických knih - například možnost změny velikosti písma podle očí uživatele.
    Nebo například to, co uvedeme pro Kindle: možnost číst knihu současně na mobilu i čtečce.
    Pro distributory je prostě PDF vyrobený pro čtečky v podobě, v jaké píšeš, neuskutečnitelný.
    GALENIUS
    GALENIUS --- ---
    GIF_242: Pak máš ještě třetí formát, o kterém ale 99,9% lidí nechce ani slyšet. PDF vyrobené přímo pro displej čtečky.
    Doma mám pro sebe PRS-505 a pro manželku Kindle 3. A i u koupených knih obvykle řeším jak je převést do editovatelného formátu, abych je mohl následně vložit do Wordu a upravit do PDF, které přechroustají obě zařízení bez problémů (včetně všeho formátování, dělení slov atd.)

    Tak, a teď jdu do těch třeskutých mrazů do lesa na dřevo a jdu si udělat hranici. 8-)
    GIF_242
    GIF_242 --- ---
    JYRKA: no to je právě to, dva formáty, proč? proč se nedohodnou a není jenom jeden?? (to je řečnická otázka, odpověď v podstatě znám) :(

    díky, jdu to omrknout
    JYRKA
    JYRKA --- ---
    GIF_242: O takovém řešení nevím. Už jen proto, že musí vznikat minimálně dva formáty: Mobi a ePUB a každý má svá specifika.
    Nicméně se nejvíce Tvému požadavku blíží Sigil - do toho jde nalít čistý text a ten opracovat do podoby validního ePubu.
    GIF_242
    GIF_242 --- ---
    JYRKA: "Hledám" něco ala InD co by udělalo eKnihu, protože to co jsi předváděl na tom workshopu, mi přišlo strašně "kostrbaté". Tím myslím, používat XY věcí, abych z toho dostal něco, co bude OK zobrazene jenom v něčem a pro jiné zařízení to budu muset vyrobit znovu, nebo se smirit s tim, ze to bude zalomene jinak, tak to mi nepřijde jako super reseni.

    BTW nechci, aby to vyznělo, že ta přednáška byla špatná, naopak! Jenom se mi osobně zatím moc nelíbí řešení jak se momentálně eknihy vyrábí.

    Vím, zní to jako utopie, ale představoval bych si něco a teď se vrátím na začátek, něco alá InD tzn. all in one pro eBOOKy ;). Prostě něco z čeho vypadne validní formát, co přečtou všechny čtečky a bude všude zalomený tak jak jsem chtěl. Ano mohl bych použít PDF, ale...

    Na druhou stranu to v podstatě nehledám, protože pro to nemám zatím žádné další uplatnění. Ale říkam si, že je dobrý být v obraze a až jednou přijde požadavek od klienta, abychom vytvořili ebook, tak být v obraze. Na druhou stranu pokud by to měla být jedna jediná zakázka, tak outsourcing je fér řešení ;)
    JYRKA
    JYRKA --- ---
    GIF_242: Ono je otázkou, co vlastně hledáš. InDesign není nástroj na tvorbu e-knih. Už jen to, že není možné vlézt do kódu a mít knihu pod kontrolou ho diskvalifikuje.
    Jinými slovy: ideální by bylo, aby příliš neškodil. Už jen to množství zmatených stylů, který plodí, hovoří o opaku. Obávám se nicméně, že lepš nástroj na sazbu papírových knih není a musíme se s ním smířit jako se zdrojem.
    GIF_242
    GIF_242 --- ---
    PEPAK: ano

    JYRKA: :) v tom případě díky za pěkný seminář. Vzhledem k tvé další odpovědi, můj pocit o tom, že případnou výrobu odložím/předám někomu, byl asi správný.
    MARTY63
    MARTY63 --- ---
    Takže jediná věc, co funguje, je úprava původní htm stránky ve zdrojovém epub souboru a zaškrtnutí příslušných voleb v Calibre. Díky za pomoc.
    ERGOSUM
    ERGOSUM --- ---
    MARTY63: Máš tam volby:
    MOBIvýstup tam zaškrtneš nepřidávat obsah do knihy.
    Tabulka obsahu tam Nepřidávat automaticky... Případně dáš ještě počet odkazů na nulu.
    Co děláš špatně by mě zajímalo.
    Zalamování řádků se dá ovlivnit v Heuristickém zpracování.
    MARTY63
    MARTY63 --- ---
    Seznam linků ma jednotlivé kapitoly.
    ERGOSUM
    ERGOSUM --- ---
    MARTY63: Který obsah máš na mysli? Seznam linků na jednotlivé kapitoly, který se ti otevře po stisknutí tlačítka a umožní skákat po kapitolách, nebo text s čísly stránek a názvy kapitol? To druhé je součástí textu a musel bys to editovat jako každou jinou kapitolu.
    MARTY63
    MARTY63 --- ---
    Ahoj, převedl jsem si v Calibre koupený ebook z epubu (zalamoval nesmyslně slova na konci řádky) do mobi. Naprostá spokojenost akorát i když mám zatrženou volbu "nevkládat obsah do knihy" vždycky ho tam po převodu mám (je vytvořený nesmyslně, takže ho tam mít nechci). Nevíte, v čem dělám chybu?
    PEPAK
    PEPAK --- ---
    ERGOSUM: Ano, mělo by to tak být. (Až na HTMLZ, s tím jsem se ještě nesetkal, to jen tipuju.)
    ERGOSUM
    ERGOSUM --- ---
    PEPAK: Aha. Takže jestli správně chápu, tak když mi Calibre něco převede správně do epub a do mobi ne, tak mi HTML nepomůže(a převod z epub už vůbec ne), protože Calibre nezvládl HTML do mobi.
    Respektive pomůže, pokud vymyslím jinou konstrukci, takovou, kterou Calibre do mobi dostane. Pak ale musím znát které HTML prvky umí do mobi převést.
    Výstup HTMLZ je pokud tomu rozumím, zapakovaný ten zdrojový HTML kod, který Calibre používá pro další převod.
    PEPAK
    PEPAK --- ---
    ERGOSUM: Pokud předpokládáme validní vstupy, tak by nic takového existovat nemělo, protože konverze v Calibre vypadají tak, že se zdrojový formát převede do HTML a to HTML se pak převede do cílového formátu. Tzn. pokud by něco selhalo, byl by to problém zdrojového formátu (konstrukce, kterou Calibre nedokáže převést do HTML) nebo cílového (dtto), ale to by se týkalo jakéhokoliv převodu z/do tohoto formátu, ne konkrétně z EPUB do MOBI.
    ERGOSUM
    ERGOSUM --- ---
    Trochu odjinud. Je něco, co Calibre z HTML do mobi převede a z epub/ODT ne? Případně jak taková věc vypadá v HTML zdrojáku?
    ERGOSUM
    ERGOSUM --- ---
    FERRYH: Zdrcnutí bude v pořádku.
    Problém v mobi- Jde to v něm vůbec? To je věc, která by mě zajímala. Zatím to zkouším dost bezvýsledně.

    V LO používám typografická makra(Tomáš Bílek, Julius Pastierik), nevím co neumím proti Santiagovým makrům(nepoužívám windows a tak to nevyzkouším), ale proti wordu, jak ho znám, umím o dost víc. Proto mě mimo jiné zajímalo jaké funkce mi ještě scházejí.
    Holt budu průkopník :-)

    Já tedy zůstanu u LO, ale stále ladím nástroje a převod z papíru zatím jen zkouším(pár věcí bych si rád přetáhnul).
    Hlavně mě zajímá výroba z hotového textu a sazba eknih.
    FERRYH
    FERRYH --- ---
    ERGOSUM: hmm, to to muzu ale pak rovnou delat asi ve wordu.

    existuje tohle:
    Convert Word Documents to ePub Format for Your eReader or iBooks - How-To Geek
    http://www.howtogeek.com/howto/28145/convert-word-documents-to-epub-format-for-your-ereader-or-ibooks/

    par lidi to zkouselo a pry to na epub neni zle ... mate s tim nekdo vetsi zkusenosti?

    ehmm, Ergo, radej to jeste zdrcnu znova v nejakem sumaru at zapomenem oc slo: ten problem je v tom mobi ...zacali jsme s tim, ze kindle mobi pri konverzich ma problem s tema tabulkama a take asi i vicesloupcovou sazbou atd. -- odtamtud jsme se propracovali k tomu, jestli existuje nejakej editor, co by ty konverze zvladal (stale se bavime o mobi) a pridali jsme k tomu to, ze je mozna pak cas prejit u ebookaru ze zdrojoveho .doc a editace ve wordu na neco jako OO at je rovnou zdroj nejak kompatibl. vic na tyto konverze, a take tam byl problem s tim pouzivanim zabehanych uz postupu po OCR a maker ve Wordu a prenosu tohodle nekam na OO ci LO..

    no ale ukazuje se ze na tohle je teda asi zbytecne brzo... OO nezvlada nic nejak lepe a vice nez ten Word a navic nema ty santiagova makra... zda se ze proste je na tohle jeste moc brzo... casem se ukaze...
    zatim teda asi nejschudnejsi reseni je doc to html tam to nejak predelat, aby to chodilo jak v ebub tak mobi veskere ty formatovacky a pak konvertovat (calibre?) do epub/mobi

    je to shrnuti spravne? zapomnel sem neco? at se netocime v kole..
    JYRKA
    JYRKA --- ---
    GIF_242: Ten seminář jsem dělal já :-)
    Problém je ten, že z InDesignu nepadají dobré výsledky a zatím to vypadá tak, že to vzdáváme - dost dobře to dělá Fragment, ten to s InDesignem skutečně umí. Nicméně pořád jim padá polotovar, který dopracováváme.
    Kliknutím sem můžete změnit nastavení reklam