Manuel de l'utilisateur de Eudora F1.5.4
Version française par J. Nzau Seke.
Annexe E - Jeux de caractères
Introduction
Cette annexe aborde en détail la manière dont Eudora gère les jeux de
caractères et la conversion du jeu de caractères.
Terminologie
Avant d'aborder la manière dont Eudora gère les jeux de caractères, il y
a quelques termes qui méritent d'être définis.
Un caractère est une unité primaire de langage écrit; une
lettre, un nombre, un signe de ponctuation (ou dans certaines langues, un
mot ou une phrase entière). Des modifications majeures à une lettre (par
exemple, la capitalisation ou l'ajout d'un accent) font de cette lettre
un caractère séparé en soi. "A", "a", "à" et "á" sont tous des caractères
différents comme le sont "B", "0", "."etc.
Un code de caractère est un nombre qui est utilisé pour
représenter un caractère donné. Puisque les ordinateurs ne fonctionnent
réellement qu'avec des nombres, les codes de caractère sont nécessaires
pour permettre aux ordinateurs de gérer des lettres, des mots et même des
manuels de l'utilisateur.
Un jeu de caractères est un groupe de caractères et
leurs codes de caractère. Par exemple, on pourrait décider de baser un
jeu de caractères sur l'alphabet anglais et numéroter simplement les
lettres capitales de 1 à 26 :
Un jeu de caractères simple
Maintenant, si nous voulions épeler le mot "CAT", nous utiliserions les
nombres 3, 1 et 20.
Le jeu de caractères "US-ASCII"
Le jeu de caractères décrit ci-dessus est un jeu simple. Trop simple, en
fait. Quid si vous voulez épeler "The cat sat on the mat."? Vous ne
pourrez pas, car il n'y a que des capitales et pas d'espace ou de point.
Il y a longtemps, un jeu de caractères fut créé pour accommoder l'usage
de l'anglo-américain très commun. Ce jeu de caractères est devenu connu
sous le nom de "US-ASCII". Il est bien plus riche que des seules lettres
capitales :
Le jeu de caractères US-ASCII
En utilisant l'US-ASCII, vous pouvez écrire "The cat sat on the mat.", en
utilisant cette séquence de nombres : 84, 104, 101, 32, 99, 97, 116, 32,
115, 97, 116, 32, 111, 110, 32, 116, 104, 101, 109, 97, 116, 46.
Le jeu de caractères US-ASCII est le jeu dont l'usage est le plus répandu
sur l'Internet. La majorité des programmes Internet assume que vous
l'utilisez et la majorité des applications Internet n'en supporte pas
d'autres. Cependant, quid si vous voulez écrire "André sat on the mat."?
Il n'y a pas de code de caractère en US-ASCII pour "é"; donc comment dire
à l'ordinateur ce que vous voulez signifier ?
Le jeu de caractères du Macintosh
Le Macintosh nous permet de décrire les habitudes d'André. Le jeu de
caractères le plus commun du Macintosh a un code de caractère pour "é",
ainsi que plusieurs autres caractères non anglo-saxons.
Le jeu de caractères du Macintosh
Comme vous pouvez voir, le jeu de caractères du Macintosh est beaucoup
plus étendu que l'US-ASCII. En fait, il est deux fois plus grand. La
première moitié (codes de caractère de 0 à 127) du jeu de caractères du
Macintosh est la même que l'US-ASCII. Cependant, il y a 128 autres
caractères, dont les codes de caractère vont de 128 à 255.
Donc, en utilisant le jeu de caractères du Macintosh, nous pouvons écrire
"André sat on the mat.", parce qu'il y a un code de caractère pour le
"é", 142.
Le jeu de caractères ISO Latin-1
Malheureusement, tout le monde n'utilise pas un Macintosh, donc tout le
monde n'a pas accès au jeu de caractères du Macintosh. Les jeux de
caractères qu'utilisent les autres ordinateurs varient grandement. La
plupart utilisent des jeux de caractères qui sont les mêmes que
l'US-ASCII pour les codes de caractère de 0 à 127. Toutefois, s'ils
fournissent des caractères au-delà de l'US-ASCII, ils le font souvent
avec des codes de caractère autres que ceux choisis par le Macintosh.
C'est-à-dire, que sur certains ordinateurs "é" n'a pas un code de
caractère de 142, mais pourrait à la place avoir un code de caractère de
237. Ainsi, s'ils vous envoyaient du texte avec "André" en son sein, il
apparaîtrait sur votre écran comme "AndrÌ", ce qui ne serait pas très
efficace.
Afin de résoudre ce type de problème, des accords sur certains jeux de
caractères courants se sont dégagés. Un jeu de caractères populaire
s'appelle "ISO Latin-1" ou "ISO-8859-1".
Le jeu de caractères ISO Latin-1
Un ordinateur peut dire à un autre "Utilisons ISO Latin-1" et alors les
deux ordinateurs sauront que le code de caractère pour "é" est 233
lorsqu'ils se parlent, même si l'un peut utiliser habituellement le 142
et l'autre pourrait utiliser habituellement 237.
Encodage "Imprimable guillemeté" (Quoted-Printable)
Il y a cependant un problème associé à l'utilisation du jeu de caractères
ISO Latin-1. Le SMTP (le protocole utilisé pour faire voyager le courrier
sur l'Internet) ne peut pas utiliser des codes de caractère plus grands
que 128. Donc notre beau "é", avec son code de caractère de 233, ne peut
être envoyé sur l'Internet. Si vous essayez, il y a des chances qu'il
aura 128 soustrait de sa valeur, ce qui donne 105, qui est "i". "André"
devient "Andri", ce qui ne va pas.
Ce problème est évité par l'usage de l'encodage "imprimable guillemeté".
Pour représenter un caractère en utilisant l'encodage imprimable
guillemeté, votre serveur de courrier convertit la valeur du caractère à
deux chiffres hexadécimaux et les précède d'un signe d'égalité. Donc, "é"
devient "=E9" pendant que votre courrier est envoyé. Le serveur de
courrier de votre destinataire rechange alors le "=E9" en un "é" et :
«Il est démontré, disait-il, que les choses ne peuvent être autrement;
car tout étant fait pour une fin, tout est nécessairement pour la
meilleure fin.» -- Voltaire, "Candide"
L'encodage imprimable guillemeté est une chose magnifique lorsqu'elle
marche. Le problème est que toutes les applications de courrier ne sont
pas aussi prospectives qu'Eudora et toutes ne supportent pas le MIME. Si
vos destinataires n'ont pas le MIME, ils peuvent trouver la présence de
l'encodage imprimable guillemeté plus insupportable que la mutilation de
quelques caractères spéciaux. Ils peuvent souhaiter pouvoir avoir
"André",mais s'ils ne le peuvent pas, ils pourraient plutôt avoir "Andri"
que "Andr=E9".
Par ailleurs, si on utilise l'encodage imprimable guillemeté, il affecte
plus que les caractères internationaux seuls. Puisque "=" est utilisé
dans l'encodage, il doit être encodé spécialement et tous les signes
égale dans votre courrier seront transformés en "=3D" lors de l'envoi de
votre courrier. En outre, le courrier encodé en imprimable guillemeté
doit avoir des lignes qui n'excèdent pas 76 caractères de long; les
lignes plus longues que ça seront coupées en deux et un signe égal placé
à la fin de la première ligne. Tout ce dommage est réparé si le
destinataire a une application de courrier MIME, mais dans le cas
contraire, cela peut être assez désagréable.
Désactiver l'encodage imprimable guillemeté
S votre destinataire n'a pas une application de courrier MIME, il y a
plusieurs manières d'éviter l'utilisation de l'encodage imprimable
guillemeté. Ces dernières sont expliquées ci-dessous.
N'utilisez pas les caractères internationaux
La manière la plus simple d'éviter l'imprimable guillemeté est de ne pas
utiliser de caractères internationaux. Évitez "André" et Eudora
n'utilisera pas l'imprimable guillemeté. Toutefois, il y a une attrape à
ceci; lorsqu'Eudora envoie des annexes de texte pur et que l'option
Toujours inclure l'information Macintosh est désactivée, Eudora utilisera
toujours l'encodage imprimable guillemeté pour l'annexe. Ceci parce
qu'Eudora doit décider si elle utilise ou non l'imprimable guillemeté
avant de commencer à envoyer l'annexe, alors qu'elle ne sait pas encore
si l'annexe contient des caractères spéciaux. Eudora préfère choisir la
prudence et utilise toujours l'imprimable guillemeté pour les annexes de
texte pur.
Utiliser Convertir les guillemets
L'option Convertir les guillemets est une manière d'éviter d'utiliser
l'imprimable guillemeté si votre courrier contient juste quelques
caractères spéciaux; à savoir "guillemets arrondis", balle et tirets
courts et longs. Comme ces caractères apparaissent souvent dans des
documents Macintosh, mais ont des équivalents US-ASCII très proches,
certains utilisateurs choisissent d'avoir ces caractères convertis en
US-ASCII. Si vous activez Convertir les guillemets, ces caractères seront
changés en US-ASCII et ils n'invoqueront pas l'imprimable guillemeté.
Utiliser la table de conversion US-ASCII
Une autre manière d'éviter l'imprimable guillemeté est d'installer les
EudoraTables et de choisir la table de conversion US-ASCII (voyez la
section "Tables de conversion"). Celle-ci transcode tous les caractères
internationaux en leurs équivalents US-ASCII les plus proches. "André"
deviendra "Andre"; pas terrible, mais peut-être meilleur qu'"Andri" ou
"Andr=E9".
Désactiver l'icône QP
L'icône QP sur la barre d'icônes d'une fenêtre de composition contrôle si
oui ou non Eudora est autorisée à user de l'encodage imprimable
guillemeté. Si vous décochez l'icône QP, Eudora n'utilisera pas
l'imprimable guillemeté pour ce message, quoi qu'il en soit.
Désactivez l'option QP utilisable
La case d'option QP utilisable dans la zone de dialogue Paramètres (Envoi
du courrier) commande l'option prédéfinie de l'icône QP. Si vous la
désactivez, les messages que vous créez n'utiliseront jamais l'encodage
imprimable guillemeté.
Tables de conversion
Lorsqu'Eudora envoie du courrier qui inclut des caractères comme "é",
elle opère normalement une "conversion" (Eudora change le code de
caractère du jeu de caractères du Macintosh au jeu de caractères ISO
Latin-1). Ainsi, "é" passe de 142 (le code de caractère du Macintosh) au
233 (le code caractère ISO Latin-1). Lorsqu'Eudora reçoit du courrier,
l'inverse est fait, et 233 devient 142.
Ce processus est contrôlé par les "tables de conversion" ("tables" en
raccourci) qui sont stockées sous forme de ressources 'taBL'. Une table
consiste en 256 numéros. Les tables sont utilisés en se servant du code
de caractère pour être converti en un index dans la table et en le
remplaçant par la valeur trouvée à cette position dans la table. Par
exemple, lorsqu'on opère une conversion d'un "é" du jeu de caractères
Macintosh au jeu de caractères ISO Latin-1, nous regardons à la place 142
dans la table (142 est le code de caractère du Macintosh pour "é"); là
nous trouvons un 233 (le code de caractère ISO Latin-1 pour "é"), et
ainsi nous remplaçons 142 par 233.
Eudora vient avec quatre ressources 'taBL'. Leurs identifiants de
ressource et utilité sont :
- 1001 ISO Latin-1 vers Macintosh.
- Cette table est utilisée pour opérer une conversion des codes de
caractère en ISO Latin-1 vers les codes de caractère contenus dans le jeu
de caractères du Macintosh.
- 1002 Macintosh vers ISO Latin-1.
- Cette table est utilisée pour opérer une conversion du jeu de
caractères Macintosh vers le jeu de caractères ISO Latin-1.
- 1003 Table d'identité.
- Cette table est fournie comme une référence pour les gens qui
souhaitent écrire leurs propres tables.
- 1004 Table de conversion des guillemets arrondis.
- Cette table est utilisée par l'option Convertir les guillemets, pour
les personnes qui voudraient plutôt s'en tenir à l'US-ASCII là où est
c'est possible.
Tables supplémentaires
Si l'ISO-Latin-1 n'est pas le jeu de caractères pour vous, il est
possible d'obtenir d'Eudora de vous offrir plus de choix. Glissez
simplement le document "Eudora Tables" dans votre dossier Préférences :
Installation du document Eudora Tables
Une fois que le document Eudora Tables a été installé, lancez Eudora. Le
menu de "Changer" présente désormais quelques choix nouveaux. Ces choix
vous permettent de contrôler la manière dont votre courrier est
transcodé.
Menu avec les tables de conversion
Messages entrants
La table (s'il échet) qui est utilisée pour afficher le message en cours
est cochée. La table qui est utilisée par défaut (s'il échet) pour
visionner les messages est contrastée.
Pour changer la table qui est utilisée pour afficher un message,
sélectionnez la table que vous voulez utiliser à partir du menu déroulant
Message sous l'article Changer, sous-article Conversion. Le message est
réaffiché en utilisant cette table, et cette table est utilisée pour
afficher le message à partir de cet instant.
Messages sortants
La table (s'il échet) qui est utilisée lorsque le message en cours est
envoyé est cochée. La table qui est utilisée par défaut (s'il échet)
lorsque vous envoyez des messages est contrastée.
Pour changer la table qui est utilisée pour envoyer le message,
sélectionnez simplement la table que vous voulez utiliser à partir de
l'article Changer du menu déroulant Message et en optant pour les
sous-article Conversion.
Tables prédéfinies
Si vous voulez habituellement voir ou imprimer votre courrier avec une
table particulière, tenez enfoncée la touche [majuscule] lorsque vous
sélectionnez, pour un message entrant, la table à partir de l'article
Changer, sous-article Conversion du menu déroulant Message. Le titre de
la table est contrasté dans le sous-menu Conversion pour indiquer qu'il
s'agit de la table prédéfinie et dès cet instant vos messages sont
visionnés avec cette table, à moins que vous ne spécifiez autrement.
Note: Si un message entrant utilise MIME et Eudora connaît le jeu de
caractères qu'utilise le message, elle opère la conversion du message
avant son stockage et une table de visionnement n'est ni nécessaire ni
utilisée.
Si vous voulez habituellement utiliser une table particulière pour le
courrier sortant, tenez la touche [majuscule] enfoncée lorsque vous
sélectionnez la table à partir du menu local Priorité pour un message
sortant. Le titre de la table est contrasté dans le sous-menu Concersion
pour indiquer qu'il s'agit de la table prédéfinie et que dès cet instant
vos messages sortants sont expédiés en utilisant cette table, à moins que
vous n'en décidiez autrement.
Pour éliminer la table prédéfinie, tenez la touche [majuscule] enfoncée
et sélectionnez la table contrastée du menu approprié. Il n' y a plus
alors de table prédéfinie.
Pas de table du tout
Si vous voulez qu'un message particulier ne soit pas affiché (ou envoyé)
avec une table quelconque, déroulez le menu Message, choisissez Changer
et Conversion. La table en vigueur pour ce message particulier est
cochée. Choisissez l'élément coché; la coche est effacée et aucune table
n'est utilisée lorsque ce message est affiché (ou envoyé).
Sommaires
Pour du courrier non-MIME, les lignes d'expéditeur et de sujet sont
passées par la table de visualisation prédéfinie lorsque le courrier
arrive et placées dans le sommaire du message (pour affichage dans les
fenêtres de classeur et dans la zone de sujet éditable). Les changements
subséquents de table de visualisation n'affecteront pas les sommaires.
Pour le courrier MIME entrant, aucune conversion de ce genre n'est
opérée, parce que le MIME a un mécanisme pour spécifier les jeux de
caractères dans les noms et les sujets.
Ph et Index
Les requêtes Ph et Index subissent une conversion selon les tables
prédéfinies par ailleurs (cf. ci-dessus).
Annexes
Les tables de conversion ne sont normalement pas utilisées lorsque vous
envoyez ou recevez des annexes, à moins que ces annexes ne soient des
documents de texte pur. Si les annexes sont des documents de texte pur,
elles subiront une conversion si l'option "Toujours comme documents" est
désactivée, ou si le type d'annexe "AppleDouble" est choisi.
Créer de nouvelles tables
Si vous essayez d'utiliser un jeu de caractères qu'Eudora ne comprend
pas, vous pouvez construire des tables pour lui. Vous aurez besoin de
créer deux ressources 'taBL', et probablement votre propre ressource
'euTM' également.
Choisir des identifiants de ressource (Resource Id's)
Vous avez besoin de choisir deux id de ressource pour vos tables. Ces id
doivent être consécutifs, le nombre inférieur étant impair. L'id impair
est utilisé pour le courrier entrant et l'id pair pour le courrier
sortant. Afin d'éviter des conflits d'id, prenez le code pays du
Macintosh, multipliez-le par 10 et ajoutez-y 2000, et ajoutez 1 si la
table est pour le courrier entrant ou 2 si la table est pour le courrier
sortant. Par exemple, la table qui cartographie l'ASCII suédois aux
caractères du Macintosh est :
10*7 (7 est le code pays pour la Suède) + 2000 + 1 (puisque la table est
utilisée pour recevoir du courrier), ou 2071.
Créer les ressources 'taBL'
Une fois que vous avez choisi les id, créez les ressources 'taBL'.
L'éditeur général de ResEdit fonctionne assez bien pour les tables. Vous
souhaiterez probablement copier l'id de ressource 'taBL' 1003 comme point
de départ. De cette manière, vous n'aurez qu'à modifier les parties du
jeu de caractères du Macintosh qui doivent subir une conversion. Les noms
des ressources seront utilisés dans les menus, donc nommez les ressources
de table de manière descriptive. C'est aussi une bonne idée de créer vos
ressources dans un document ente; document de type 'rsrc' et de créateur
'CSOm'. De cette manière, les utilisateurs peuvent facilement installer
et enlever votre table, et votre table ne sera pas effacée s'ils
rehaussent leur copie d'Eudora ou des Tables d'Eudora.
Créer une ressource euTM
La ressource 'euTM' est utilisée pour nommer des jeux de caractères. Les
jeux de caractères doivent être nommés de manière que les applications de
courrier sachent quel jeu de caractère est utilisé. Les noms MIME
officiels pour les jeux de caractères sont souvent très déplaisants. Par
exemple, le nom pour un jeu de caractères suédois courant est
"SEN_850200_B".
Partie d'une ressource euTM
La ressource 'euTM' est une liste d'id de ressource et de noms.
Lorsqu'Eudora envoie du courrier, il soustraira 1 de l'id de ressource de
la table, puis cherchera cet id de ressource dans toutes les ressources
'euTM' qu'il pourra trouver. Lorsqu'il trouve un id correspondant, le nom
correspondant à l'id est utilisé.
Par exemple, un utilisateur choisissant la table Mac->se utiliserait
l'id de table 2072. Eudora soustrait un, trouve 2071 dans la deuxième
position dans la ressource 'euTM' et envoie le courrier avec un nom de
jeu de caractères "SEN_850200_B".
Lorsqu'on reçoit du courrier, le processus est inversé; le nom du jeu de
caractères est recherché, l'id de ressource trouvé et cette table de
conversion est utilisée pour le courrier.
Pour votre table, vous devriez créer une ressource 'euTM', énumérer l'id
de ressource de votre table (uniquement l'id impair) et le nom qui doit
être utilisé dans le courrier pour ce jeu de caractères.
Retour à la table des matières
5 octobre 1996.
Version HTML : Jean-Pierre
Kuypers