atelier des textes

Déverminage d'un texte balisé

Les messages d'erreur émis par les compilateurs ne sont pas d'une grande clarté. La raison principale est par contre claire : il n'y a pas de grammaire rigoureuse sémantique à la base. Et la grammaire qui est à la base des langages de balisage est purement formelle (voir par ex. la grammaire donnée dans le TeXBook de Knuth). Si l'écrivain-baliseur contrevient à une règle formelle, le repérage est (quelquefois) moins difficile.

En général, le compilateur (tex, latex, pdflatex, context ou texexec ou un autre) indique un numéro de ligne où il a arrêté de compiler. L'erreur se trouve avant cette ligne et souvent bien avant.

Le plus simple est d'insérer avant le paragraphe où l'erreur est censée se trouver une balise de fin de document. Donc selon le cas \bye ou \end{document} ou \stoptext.

Relire attentivement le message.

Si l'erreur persiste, déplacer la fin de document vers le haut.

Si la compilation réussit, déplacer la fin de document vers le bas.

Progressivement on arrive à localiser l'erreur. Deux issues: soit on arrive à corriger, soit on n'y arrive pas. Là, il faut appeler à l'aide - sans perdre trop de temps.

Latin-1 et UTF-8

Nous vivons une grandiose époque de transition entre 1900 et 2100. Un siècle va être consacré à passer du codage Latin-1 au UTF-8. Et pendant ce laps de temps, il faut se méfier des copier-coller d'un texte ancien vers un nouveau ; en général le changement de codage n'est pas automatique et quand il l'est, c'est encore plus catastrophique.

Un texte ancien est en général codé en Latin-1. Il faut le convertir en UTF-8. Solutions: (1) manuellement, (2) iconv (lire le manuel), (3) à l'aide de l'éditeur. Comme je ne connais qu'un seul éditeur: Emacs, je ne peux pas parler des autres: Si c'est du Latin-1, emacs indique un -1 en bas à gauche. Ctrl-X ENTER f permet de choisir un autre système d'encodage. On prend UTF-8. Si la conversion a été faite, on voit un -u en bas à gauche. Dès que c'est fait, on sauve.

Dès qu'on a encodé le texte ancien à la nouvelle mode, on peut copier et coller. Si on loupe cette étape, on se retrouve avec le texte nouveau pollué par des chiffres et des signes hors de propos. Si on convertit un texte pollué, on a une pollution au carré. Essayez pour voir !

Recommandation

Avant d'entreprendre de grandes manoeuvres sur des textes originaux, en faire une copie de version (j'ai ainsi beaucoup de sources dont les noms de fichier commencent par v0-, v1-, v2- ... au cas où il faudrait revenir en arrière).

Copyright 2011 (c) René Bastian - rbastian (arrobe) free.fr