Posílám slíbený komentář k Santiagovým makrům. Omlouvám se, že mi to trvalo tak dlouho.
Všechny komentáře se vztahují výhradně k popisu na stránce
http://santiago.wz.cz/stranky/popis.html - pokud se aktuální makra chovají v určitých situacích odlišně od popisu, nevšiml jsem si toho. Na reálné testování bohužel dostatek času nemám (což mne mrzí, protože některé věci by opravdu stály za pořádné otestování kvůli některým svéráznostem Wordu - viz poznámka na konci).
Když jsem procházel celý popis, tak jednou z věcí, která mi hodně vadila, byla nejednotnost v používání termínů. Je vidět, že Santiago nezná zažitou terminologii, což je docela tristní. Nejde mi přitom o žádný sazečský slang či odborný typografický žargon, ale o běžné výrazy, které lze najít i v pravopisných příručkách. Typicky to je vidět na označování jednoduchých uvozovek slovem apostrofy (to je úplně jiný znak s jiným účelem), neznalost tzv. francouzských uvozovek (říká jim šipky), neznalost spojovníku (nevadilo by mi, že tomu říká krátká pomlčka, kdyby to aspoň držel konzistentně na všech místech) apod. Pak už v momentě, kdy píše o kapitálkách, tak fakt netuším, jestli tím myslí opravdu kapitálky (tj. velká písmena psaná na výšku písmen malých), nebo verzálky (všechna velká písmena). Je to o to více mrzuté, když už před deseti lety vyšla velmi dobře udělaná knížka Praktická typografie, která i pro laiky zpřístupňuje velmi jednoduchým a názorným způsobem (nejen) typografická pravidla. Tam se zažitá terminologie dala snadno dohnat a ta knížka by měla být základem každého, kdo to myslí trochu vážněji se zpracováním textu - od redaktora a korektora až po kreativce a sazeče. Také bych ještě podotkl, že druh fontu je v zásadě nesmysl - znamenalo by to, zda jde o OpenType, TrueType či PostScript, ale to evidentně Santiago neměl na mysli. Font je pouze provedení jednoho konkrétního řezu písma v nějaké rodině. Nicméně zrovna tohle zmatení pojmů mi tam vadí zdaleka nejméně. To jen tahá za oči, ale nebrání to v pochopení autorova záměru.
Ale k samotným makrům. Komentáře budu přidávat postupně, tak jak jde popis na výše uvedeném webu.
Konverze_apostrofy (Konverze apostrofů) – Převádí apostrofy z tvaru ‚xxx‘ do tvaru ‘xxx’
Proč se zbavovat korektních českých jednoduchých uvozovek (ehm, apostrofů) a převádět je na anglické? Jasně, pokud budu dělat anglickou knihu, tak se to hodí, ale to asi nebude běžný případ uživatele těchto maker. A pokud ten, kdo upravuje text, nezná patřičné jazykové nároky na uvozovky, napáchá to v textu zbytečné chyby. Ale fajn, nemusí to pouštět (doufejme, že to neudělá).
Uprava_textu (Základní úprava textu) – Provede zakladní upravu textu
Bylo by to šikovné a užitečné makro, pokud by se daly volitelně zapínat/vypínat jednotlivé části (nevšiml jsem si té možnosti):
Odstranit ruční zalomení řádku
Bacha na případy, kdy se v knize vyskytnou třeba verše nebo nějaké výčty. Tam by
odstranění ručního zalomení řádků nebylo ideální. Ale to je jen upozornění na základě vlastní zkušenosti z převodů OCR.
Upravit krátké / dlouhé pomlčky – pomlčky obklopené textem jsou krátké, v ostatních případech dlouhé
Hrubá chyba. Sice spojovník (krátká pomlčka) skutečně nemůže být nikdy obklopen mezerami, tak je to vždy (dlouhá) pomlčka, ale ten druhý případ už tak jasný není. Spojovník je použit v případech jako třeba "není-li", Frýdek-Místek, kulturně-politický apod., ale (dlouhá) pomlčka má bez mezer také hodně uplatnění. Pomlčka označuje rozsah (0–10, tj. nula až deset; A–Z, tj. A až Z nebo od A do Z), trasu (rychlík Praha–Brno) či nějaký vzájemný vztah (zápas Sparta–Slávie). Bohužel neexistuje žádný jednoznačný algoritmus, který by umožnil v případě bez mezer určit, zda bude pomlčka nebo spojovník, protože lze psát číslice se spojovníkem (typicky ISBN kódy) i s pomlčkou (rozsahy, letopočty), i písmena se spojovníkem i pomlčkou (Frýdek-Místek vs. Praha–Brno).
A ne, opravdu to není jedno, jak se to píše. Čeština je schopna nést v interpunkčních znaménkách mnoho přidaných informací a pokud to jedna strana umí správně použít a druhá správně číst, je komunikace stručnější a přitom informačně bohatá.
Odstranit mezery před ?!.;:trojtečka
Globální odstraňování mezer před tečkou a dvojtečkou je nešťastné. S mezerou před tečkou se sice v beletrii často nesetkáme (jsou to spíše specifické případy jako třeba "soubor .pdf"), ovšem dvojtečka může mít mezeru před oprávněně i v beletrii. Používá se např. pro označení skóre či poměru - vyhrál 10 : 0, namíchej mi to v poměru 1 : 3. Tam mezera být má (ideálně by měla být zúžená, ale to Word nenabízí).
Ironií u tohoto případu je to, že jsem to před časem měl ve svém vlastním skriptu. Ale poté, co mi přišla vynadat jedna korektorka (oprávněně), že jsem zprasil text, který po autorovi předělávala mnoho hodin, tak jsem to hodně rychle ze skriptu vykopal. Je to zase další případ neexistence jednoznačného algoritmu, který by byl případy schopen odlišit. Používat se to dá jedině v případech, že si je dotyčný opravdu naprosto jist, že tam nebude mít žádnou výjimku.
Doplnit mezeru za :;?!trojtečka pokud následuje písmeno [a-Ž]
Bacha na použití vykřičníku v některých jazycích - Romština ho používá jako vokativ před poslední slabikou (Roma!le), zapisuje se tak také tzv. mlaskavka v některých jazycích (herec N!xau) a oblíbili si ho v tomto využití i někteří autoři, kteří drze nechávají mluvit mimozemšťany kuriózními jazyky místo toho, aby použili univerzální jazyk č. 7.
Upravit apostrofy… (uvozovky!)
mezera čárka libovolné písmeno
Mno, mám tady jeden text, který jsem omylem dostal ještě před korekturou. Autor tady sice náhodně, zato velmi vytrvale dělá tutéž chybu - zhruba třetinu interpunkčních čárek píše až po mezeře ,tj. to vypadá takhle. To potřebuje ruční úpravu, pustit na tohle makro bez předchozího projití textu by nic nevyřešilo, jen bych tam měl místo blbě umístěné čárky blbě umístěnou dolní uvozovku.
Jinak oprava uvozovek a interpunkce po některých autorech je opravdu mor. Za funkčním algoritmem šel bych světa kraj…
Nahrad_pevna_mezera, (Vložení pevných mezer) – Doplňuje nezalomitelnou mezeru v následujících volitelných případech.
před trojtečkou
To je hrubá chyba. I trojtečka (výpustka) je normální interpunkce, která se váže k předchozímu znaku (resp. slovu) bez mezer. Sice se najdou specifické případy, kdy mezera před trojtečku patří (např. přerývaná řeč hlavního hrdiny, který, chroptící těsně před smrtí, musí vyjevit zásadní životní pravdu), ale takových případů je mizivé procento.
po dlouhé pomlčce
Velmi nevhodné. Pokud je pomlčka normálně v textu, stejně se nesmí objevit na začátku řádku, tj. musí být pevná mezera před pomlčkou (to v makru je, to je ok). Ovšem v momentě, kdy svážu s pomlčkou slovo před i slovo po, mohu získat velmi dlouhý výraz, který se bude držet při sobě, což vzhledem k prakticky neexistujícím dělicím slovníkům ve čtečkách znamená, že v textu budou vznikat zbytečné díry na konci řádků. Velmi podobný problém ale vzniká i v papírové sazbě na úzký sloupec (typicky novinová sazba) - tam je svázání pomlčky se slovem po také nevhodné.
V této části makra je škoda, že nedoplňuje nedělitelnou mezeru také po dvoj- a trojznakových předložkách (ve, pod, na…). U knih by to měla být naprostá samozřejmost, u papírové sazby, která umí dobře vázat text do bloku, nastavuju většinou nedělitelnou mezeru i po delších předložkách (před, pode).
Spojovani_textu (Spojení odstavců) – spojuje chybně rozdělené odstavce v případě když:
spojení odstavců kde je nakonci "–" a nasledující řádek začíná malým písmenem
Tady váhám, jestli je myšlena opravu pomlčka, nebo to je spojovník. Ale to je jedno. Společně s
spojení odstavců kde je nakonci malé písmeno nebo čárka a následující řádek začíná malým písmenem
je to další zrádný zdroj nových chyb v rukou nepoučeného uživatele. Už jsem to psal výše - tohle se nesmí udělat tam, kde se v textu často vyskytují verše (což je třeba u fantasy poměrně často u různých věšteb, zaklínadel apod.) a podobně strukturované texty.
Uprava_pismen (Úprava malá / velká písmena) – převádí špatně rozpoznané malá pismena na velká a naopak v těchto případech:
malé písmeno je z obou stran ohraničené velkým písmenem
velké písmeno je z obou stran ohraničené malým písmenem
velké písmeno na konci slova pokud mu předchází malé písmeno
malé písmeno na začátku věty
velké písmeno na začátku slova ve větě
Tohle je celé dost k ničemu a je to jen zdroj nových chyb.
Malé písmeno z obou stran ohraničené velkým (a naopak) - chudáci Irové i Normani s jejich McDonaldy, MacCormacky, FitzPatricky a další.
Automaticky rozpoznávané malé písmeno na začátku věty vede ke wordovským zvěrstvům jako 16. Listopadu, 5. Ročník apod.
Odstranění velkého písmena uprostřed věty zase odstraní všechna vlastní jména, tedy praha, martin apod.
Jediné, co je z tohoto bloku užitečné, je odstraněné velkého písmena na konci slova. Tedy pokud to nevypustím na knihu o WoW.
Odstraneni_vsech_prazdnych_radku (Odstranění všech prázdných řádků) – Odstraní všechny prázdné řádky.
Tohle mne neskutečně štve, když občas sáhnu na xtrance po nějakém textu. Tam, kde v knize byl prázdným řádkem označen nějaký oddíl (že je děj na jiném místě, v jiném čase apod.), případně kde byla báseň či píseň rozdělena na sloky, tam je to smatlané celé v jednom bloku. Kdyby aspoň ten umělec, co tohle makro pustí, tam doplnil v rámci stylu odstavce mezeru před odstavcem, tak by se to dalo přenést a zobrazit, ale formátování textu a odstavce je pro většinu bohužel pojem neznámý.
Já makro na odstraňování prázdných řádků mám. Ted makro… Je to uložený GREP dotaz pro InDesign, který při tvorbě ePubu pouštím. Ale jedu tak, že ručně potvrzuju každou záměnu a hlavně tam měním styl odstavce tak, aby odstavec měl jako vlastnost mezeru před. Tj. neexistuje mi tam prázdný řádek, který by dělal bordel na konci/začátku stránky, ale opticky je to pro čtenáře i nadále oddělené tak, jak to autor textu zamýšlel.
V tomhle kontextu mne fascinuje, jak proti duchu odstranění prázdných řádků jde makro vkládání prázdných řádků, které se má pouštět před odstraněním stylů. Odstranění stylů bych tedy neřešil takhle hrubou silou. I když ono to ve Wordu asi o moc lépe nejde, se styly pracuje velmi mizerně. Vhodnější je cesta záměny za jiné, dobře připravené styly. Výsledkem by rozhodně neměl být text bez jakýchkoli stylů s formátováním prováděním
ad hoc lokálně, ale měl by to být text s dobře strukturovanými styly (včetně znakových stylů pro zvýraznění textu - tučně, kurziva apod.), které lze snadno upravit a dosáhnout tak rychlé a efektivní změny vzhledu bez poškození obsahu či předávané informace.
Dále už pak následují formátovací a kontrolní makra. K formátovacím mám sice spoustu výhrad, ale aspoň je tam nějaká snaha a navíc upravit formát není takový problém (většinou). Ke kontrolním makrům pak nemám větších výhrad - to jsou aspoň nedestruktivní zásahy.
Celkově mi tedy velmi vadí makra, která provádějí změny v textu tam, kde to nemá co dělat. Kromě vyložených chyb tam je hlavně spousta případů, které to devětkrát udělají dobře a v desátém případě je z toho chyba. Takové náhrady nejsou a priori špatné, ale nemají co dělat v žádném globálním makru či skriptu. Mluvím z vlastní zkušenosti, naběhl jsem si s tím nejen sám, ale opravoval jsem dost textů, kde nadšený redaktor či korektor pustil velmi nevhodnou globální záměnu (příkladem budiž třeba záměna "za druhé" na "zadruhé" - ano, pokud autor píše něco zaprvé, zadruhé, zatřetí, pak tam nemá mezera co dělat, jenže jakmile žák dostane známky zadruhé pololetí, už nadšení z automatické záměny mizí).
Pokud tady (nejen) Ferryh horuje za to, aby se takováto makra dostala do rukou sazečům produkujícím špatně udělané knížky, pak není divu, že tady prskám. Tele, které neumí pořádně udělat svou práci, by s těmito makry nasekalo spoustu úplně nových chyb. Tohle je výsledek, po kterém čtenáři touží?
Je opravdu naivní a velmi nebezpečné si myslet, že nějaká makra mohou nahradit odfláknutou redakční práci. Když dělám knihy pro sebe a pro své blízké, mohu si dovolit nehledět na čas a dělám práci velmi pečlivě. Makra používám (konkrétně své vlastní skripty a GREP dotazy pro InDesign), ale přesto pak následuje mravenčí práce s několikerým čtením hotové sazby, kdy si vyznačuji všechny chyby, o které mi oko zakopne. Běžně si tak aktualizuju knihy, které mám ve čtečce. Jenže tohle není reálné ani ve větším měřítku pro větší skupinu nadšenců ochotných chybu reportovat, natož v běžné vydavatelské praxi, kde je nutné zaplatit čas všech lidí, kteří se na knize podílejí (a když slyším ten řev, jak jsou vydavatelé nenažraní, tak už vidím to nadšení, že by si vydavatel řekl o pár korun navíc, aby mohl nechat knížku projít ještě jedním čtením u dalšího korektora).
-----
Pozn. - chyby Wordu
Word v určitých situacích vykazuje velmi nestandardní chování a ignoruje některé znaky. Typickým příkladem jsou uvozovky. Pokud v textu nechám najít znak " a nahradit znakem " (tj. ty klasické "počítačové" uvozovky), nahradí to korektně za klasické typografické uvozovky dle nastavení jazyka (tj. v češtině to je „takto“ - dolní devítky ALT+0132 na začátku a horní šestky ALT+0147 na konci). I pokud jsou tam korektní české uvozovky (tzn. „ a “), nahradí je taky správně - nebo aspoň tam, jak si
myslí, že to je správně, tedy řídí se tím, jestli je před/za nimi mezera). Problém nastane, když jsou v dokumentu původně uvozovky anglické - tedy “English” (na začátku horní šestky ALT+0147, na konci horní devítky ALT+0148). Wordovské vyhledávání pak ty horní devítky vůbec nenajde, a tedy ani nenahradí. Vyzkoušeno na českém Wordu 2010 a 2013, ale pokud vím, je ten bug výrazně starší.
Kromě toho český Word sice během psaní umí správně vytvářet uvozovky podle jazyka textu (tj. pokud píšu česky, mám „“, pokud anglicky, mám “”, ovšem jakmile nechám v celém textu nahradit " za ", pak se pokusí i v anglickém textu nahradit uvozovky za české, ovšem s kombinací výše uvedeného bugu to celé podělá a první uvozovka bude česká, druhá anglická.
A ještě jeden uvozovkový bug by tady byl. Pokud je v textu před uvozovkou nedělitelná mezera, tj. například v•"lese", Word chybně umístí první uvozovku nahoru, tj. měl by to správně nahradit na v•„lese“, ale místo toho tam bude v•“lese“.
Dalším oblíbeným "bugem" či spíše nedomyšleností, tentokrát už mimo uvozovky, je velmi špatné zobrazování a používání znakových stylů a lokálních úprav textu. Ve Wordu vypadá text jednotně, všude je stejné písmo, stejná velikost, ale při exportu je odstavec plný oblastí se špatným znakovým stylem či jinou barvou. Tyto úpravy textu se ve Wordu hledají těžko, ale při exportu napáchají spoustu starostí - a to jak v klasické sazbě, tak i při převodu do ePubu. Santiago s tím počítá u čištění textu, ale Word dokáže být občas velmi aktivní i při všech vypnutých automatických náhradách. Stačí někam vložit jiný text…
-----
A ještě na okraj - jsem si vědom toho, že jsem v tomto příspěvku používal setrvale špatné uvozovky i pomlčky. Do sazby bych to nepoužil, v diskusních fórech to beru ale laxně, i když technicky by to nebyl problém.