Manuel de l'utilisateur de Eudora F1.5.4

Version française par J. Nzau Seke.

Annexe E - Jeux de caractères

Introduction

Cette annexe aborde en détail la manière dont Eudora gère les jeux de caractères et la conversion du jeu de caractères.

Terminologie

Avant d'aborder la manière dont Eudora gère les jeux de caractères, il y a quelques termes qui méritent d'être définis.

Un caractère est une unité primaire de langage écrit; une lettre, un nombre, un signe de ponctuation (ou dans certaines langues, un mot ou une phrase entière). Des modifications majeures à une lettre (par exemple, la capitalisation ou l'ajout d'un accent) font de cette lettre un caractère séparé en soi. "A", "a", "à" et "á" sont tous des caractères différents comme le sont "B", "0", "."etc.

Un code de caractère est un nombre qui est utilisé pour représenter un caractère donné. Puisque les ordinateurs ne fonctionnent réellement qu'avec des nombres, les codes de caractère sont nécessaires pour permettre aux ordinateurs de gérer des lettres, des mots et même des manuels de l'utilisateur.

Un jeu de caractères est un groupe de caractères et leurs codes de caractère. Par exemple, on pourrait décider de baser un jeu de caractères sur l'alphabet anglais et numéroter simplement les lettres capitales de 1 à 26 :

Un jeu de caractères simple

Maintenant, si nous voulions épeler le mot "CAT", nous utiliserions les nombres 3, 1 et 20.

Le jeu de caractères "US-ASCII"

Le jeu de caractères décrit ci-dessus est un jeu simple. Trop simple, en fait. Quid si vous voulez épeler "The cat sat on the mat."? Vous ne pourrez pas, car il n'y a que des capitales et pas d'espace ou de point. Il y a longtemps, un jeu de caractères fut créé pour accommoder l'usage de l'anglo-américain très commun. Ce jeu de caractères est devenu connu sous le nom de "US-ASCII". Il est bien plus riche que des seules lettres capitales :

Le jeu de caractères US-ASCII

En utilisant l'US-ASCII, vous pouvez écrire "The cat sat on the mat.", en utilisant cette séquence de nombres : 84, 104, 101, 32, 99, 97, 116, 32, 115, 97, 116, 32, 111, 110, 32, 116, 104, 101, 109, 97, 116, 46.

Le jeu de caractères US-ASCII est le jeu dont l'usage est le plus répandu sur l'Internet. La majorité des programmes Internet assume que vous l'utilisez et la majorité des applications Internet n'en supporte pas d'autres. Cependant, quid si vous voulez écrire "André sat on the mat."? Il n'y a pas de code de caractère en US-ASCII pour "é"; donc comment dire à l'ordinateur ce que vous voulez signifier ?

Le jeu de caractères du Macintosh

Le Macintosh nous permet de décrire les habitudes d'André. Le jeu de caractères le plus commun du Macintosh a un code de caractère pour "é", ainsi que plusieurs autres caractères non anglo-saxons.

Le jeu de caractères du Macintosh

Comme vous pouvez voir, le jeu de caractères du Macintosh est beaucoup plus étendu que l'US-ASCII. En fait, il est deux fois plus grand. La première moitié (codes de caractère de 0 à 127) du jeu de caractères du Macintosh est la même que l'US-ASCII. Cependant, il y a 128 autres caractères, dont les codes de caractère vont de 128 à 255.

Donc, en utilisant le jeu de caractères du Macintosh, nous pouvons écrire "André sat on the mat.", parce qu'il y a un code de caractère pour le "é", 142.

Le jeu de caractères ISO Latin-1

Malheureusement, tout le monde n'utilise pas un Macintosh, donc tout le monde n'a pas accès au jeu de caractères du Macintosh. Les jeux de caractères qu'utilisent les autres ordinateurs varient grandement. La plupart utilisent des jeux de caractères qui sont les mêmes que l'US-ASCII pour les codes de caractère de 0 à 127. Toutefois, s'ils fournissent des caractères au-delà de l'US-ASCII, ils le font souvent avec des codes de caractère autres que ceux choisis par le Macintosh. C'est-à-dire, que sur certains ordinateurs "é" n'a pas un code de caractère de 142, mais pourrait à la place avoir un code de caractère de 237. Ainsi, s'ils vous envoyaient du texte avec "André" en son sein, il apparaîtrait sur votre écran comme "AndrÌ", ce qui ne serait pas très efficace.

Afin de résoudre ce type de problème, des accords sur certains jeux de caractères courants se sont dégagés. Un jeu de caractères populaire s'appelle "ISO Latin-1" ou "ISO-8859-1".

Le jeu de caractères ISO Latin-1

Un ordinateur peut dire à un autre "Utilisons ISO Latin-1" et alors les deux ordinateurs sauront que le code de caractère pour "é" est 233 lorsqu'ils se parlent, même si l'un peut utiliser habituellement le 142 et l'autre pourrait utiliser habituellement 237.

Encodage "Imprimable guillemeté" (Quoted-Printable)

Il y a cependant un problème associé à l'utilisation du jeu de caractères ISO Latin-1. Le SMTP (le protocole utilisé pour faire voyager le courrier sur l'Internet) ne peut pas utiliser des codes de caractère plus grands que 128. Donc notre beau "é", avec son code de caractère de 233, ne peut être envoyé sur l'Internet. Si vous essayez, il y a des chances qu'il aura 128 soustrait de sa valeur, ce qui donne 105, qui est "i". "André" devient "Andri", ce qui ne va pas.

Ce problème est évité par l'usage de l'encodage "imprimable guillemeté". Pour représenter un caractère en utilisant l'encodage imprimable guillemeté, votre serveur de courrier convertit la valeur du caractère à deux chiffres hexadécimaux et les précède d'un signe d'égalité. Donc, "é" devient "=E9" pendant que votre courrier est envoyé. Le serveur de courrier de votre destinataire rechange alors le "=E9" en un "é" et :

«Il est démontré, disait-il, que les choses ne peuvent être autrement;
car tout étant fait pour une fin, tout est nécessairement pour la 
meilleure fin.» -- Voltaire, "Candide"

L'encodage imprimable guillemeté est une chose magnifique lorsqu'elle marche. Le problème est que toutes les applications de courrier ne sont pas aussi prospectives qu'Eudora et toutes ne supportent pas le MIME. Si vos destinataires n'ont pas le MIME, ils peuvent trouver la présence de l'encodage imprimable guillemeté plus insupportable que la mutilation de quelques caractères spéciaux. Ils peuvent souhaiter pouvoir avoir "André",mais s'ils ne le peuvent pas, ils pourraient plutôt avoir "Andri" que "Andr=E9".

Par ailleurs, si on utilise l'encodage imprimable guillemeté, il affecte plus que les caractères internationaux seuls. Puisque "=" est utilisé dans l'encodage, il doit être encodé spécialement et tous les signes égale dans votre courrier seront transformés en "=3D" lors de l'envoi de votre courrier. En outre, le courrier encodé en imprimable guillemeté doit avoir des lignes qui n'excèdent pas 76 caractères de long; les lignes plus longues que ça seront coupées en deux et un signe égal placé à la fin de la première ligne. Tout ce dommage est réparé si le destinataire a une application de courrier MIME, mais dans le cas contraire, cela peut être assez désagréable.

Désactiver l'encodage imprimable guillemeté

S votre destinataire n'a pas une application de courrier MIME, il y a plusieurs manières d'éviter l'utilisation de l'encodage imprimable guillemeté. Ces dernières sont expliquées ci-dessous.

N'utilisez pas les caractères internationaux

La manière la plus simple d'éviter l'imprimable guillemeté est de ne pas utiliser de caractères internationaux. Évitez "André" et Eudora n'utilisera pas l'imprimable guillemeté. Toutefois, il y a une attrape à ceci; lorsqu'Eudora envoie des annexes de texte pur et que l'option Toujours inclure l'information Macintosh est désactivée, Eudora utilisera toujours l'encodage imprimable guillemeté pour l'annexe. Ceci parce qu'Eudora doit décider si elle utilise ou non l'imprimable guillemeté avant de commencer à envoyer l'annexe, alors qu'elle ne sait pas encore si l'annexe contient des caractères spéciaux. Eudora préfère choisir la prudence et utilise toujours l'imprimable guillemeté pour les annexes de texte pur.

Utiliser Convertir les guillemets

L'option Convertir les guillemets est une manière d'éviter d'utiliser l'imprimable guillemeté si votre courrier contient juste quelques caractères spéciaux; à savoir "guillemets arrondis", balle et tirets courts et longs. Comme ces caractères apparaissent souvent dans des documents Macintosh, mais ont des équivalents US-ASCII très proches, certains utilisateurs choisissent d'avoir ces caractères convertis en US-ASCII. Si vous activez Convertir les guillemets, ces caractères seront changés en US-ASCII et ils n'invoqueront pas l'imprimable guillemeté.

Utiliser la table de conversion US-ASCII

Une autre manière d'éviter l'imprimable guillemeté est d'installer les EudoraTables et de choisir la table de conversion US-ASCII (voyez la section "Tables de conversion"). Celle-ci transcode tous les caractères internationaux en leurs équivalents US-ASCII les plus proches. "André" deviendra "Andre"; pas terrible, mais peut-être meilleur qu'"Andri" ou "Andr=E9".

Désactiver l'icône QP

L'icône QP sur la barre d'icônes d'une fenêtre de composition contrôle si oui ou non Eudora est autorisée à user de l'encodage imprimable guillemeté. Si vous décochez l'icône QP, Eudora n'utilisera pas l'imprimable guillemeté pour ce message, quoi qu'il en soit.

Désactivez l'option QP utilisable

La case d'option QP utilisable dans la zone de dialogue Paramètres (Envoi du courrier) commande l'option prédéfinie de l'icône QP. Si vous la désactivez, les messages que vous créez n'utiliseront jamais l'encodage imprimable guillemeté.

Tables de conversion

Lorsqu'Eudora envoie du courrier qui inclut des caractères comme "é", elle opère normalement une "conversion" (Eudora change le code de caractère du jeu de caractères du Macintosh au jeu de caractères ISO Latin-1). Ainsi, "é" passe de 142 (le code de caractère du Macintosh) au 233 (le code caractère ISO Latin-1). Lorsqu'Eudora reçoit du courrier, l'inverse est fait, et 233 devient 142.

Ce processus est contrôlé par les "tables de conversion" ("tables" en raccourci) qui sont stockées sous forme de ressources 'taBL'. Une table consiste en 256 numéros. Les tables sont utilisés en se servant du code de caractère pour être converti en un index dans la table et en le remplaçant par la valeur trouvée à cette position dans la table. Par exemple, lorsqu'on opère une conversion d'un "é" du jeu de caractères Macintosh au jeu de caractères ISO Latin-1, nous regardons à la place 142 dans la table (142 est le code de caractère du Macintosh pour "é"); là nous trouvons un 233 (le code de caractère ISO Latin-1 pour "é"), et ainsi nous remplaçons 142 par 233.

Eudora vient avec quatre ressources 'taBL'. Leurs identifiants de ressource et utilité sont :

1001 ISO Latin-1 vers Macintosh.
Cette table est utilisée pour opérer une conversion des codes de caractère en ISO Latin-1 vers les codes de caractère contenus dans le jeu de caractères du Macintosh.
1002 Macintosh vers ISO Latin-1.
Cette table est utilisée pour opérer une conversion du jeu de caractères Macintosh vers le jeu de caractères ISO Latin-1.
1003 Table d'identité.
Cette table est fournie comme une référence pour les gens qui souhaitent écrire leurs propres tables.
1004 Table de conversion des guillemets arrondis.
Cette table est utilisée par l'option Convertir les guillemets, pour les personnes qui voudraient plutôt s'en tenir à l'US-ASCII là où est c'est possible.

Tables supplémentaires

Si l'ISO-Latin-1 n'est pas le jeu de caractères pour vous, il est possible d'obtenir d'Eudora de vous offrir plus de choix. Glissez simplement le document "Eudora Tables" dans votre dossier Préférences :

Installation du document Eudora Tables

Une fois que le document Eudora Tables a été installé, lancez Eudora. Le menu de "Changer" présente désormais quelques choix nouveaux. Ces choix vous permettent de contrôler la manière dont votre courrier est transcodé.

Menu avec les tables de conversion

Messages entrants

La table (s'il échet) qui est utilisée pour afficher le message en cours est cochée. La table qui est utilisée par défaut (s'il échet) pour visionner les messages est contrastée.

Pour changer la table qui est utilisée pour afficher un message, sélectionnez la table que vous voulez utiliser à partir du menu déroulant Message sous l'article Changer, sous-article Conversion. Le message est réaffiché en utilisant cette table, et cette table est utilisée pour afficher le message à partir de cet instant.

Messages sortants

La table (s'il échet) qui est utilisée lorsque le message en cours est envoyé est cochée. La table qui est utilisée par défaut (s'il échet) lorsque vous envoyez des messages est contrastée.

Pour changer la table qui est utilisée pour envoyer le message, sélectionnez simplement la table que vous voulez utiliser à partir de l'article Changer du menu déroulant Message et en optant pour les sous-article Conversion.

Tables prédéfinies

Si vous voulez habituellement voir ou imprimer votre courrier avec une table particulière, tenez enfoncée la touche [majuscule] lorsque vous sélectionnez, pour un message entrant, la table à partir de l'article Changer, sous-article Conversion du menu déroulant Message. Le titre de la table est contrasté dans le sous-menu Conversion pour indiquer qu'il s'agit de la table prédéfinie et dès cet instant vos messages sont visionnés avec cette table, à moins que vous ne spécifiez autrement.

Note: Si un message entrant utilise MIME et Eudora connaît le jeu de caractères qu'utilise le message, elle opère la conversion du message avant son stockage et une table de visionnement n'est ni nécessaire ni utilisée.

Si vous voulez habituellement utiliser une table particulière pour le courrier sortant, tenez la touche [majuscule] enfoncée lorsque vous sélectionnez la table à partir du menu local Priorité pour un message sortant. Le titre de la table est contrasté dans le sous-menu Concersion pour indiquer qu'il s'agit de la table prédéfinie et que dès cet instant vos messages sortants sont expédiés en utilisant cette table, à moins que vous n'en décidiez autrement.

Pour éliminer la table prédéfinie, tenez la touche [majuscule] enfoncée et sélectionnez la table contrastée du menu approprié. Il n' y a plus alors de table prédéfinie.

Pas de table du tout

Si vous voulez qu'un message particulier ne soit pas affiché (ou envoyé) avec une table quelconque, déroulez le menu Message, choisissez Changer et Conversion. La table en vigueur pour ce message particulier est cochée. Choisissez l'élément coché; la coche est effacée et aucune table n'est utilisée lorsque ce message est affiché (ou envoyé).

Sommaires

Pour du courrier non-MIME, les lignes d'expéditeur et de sujet sont passées par la table de visualisation prédéfinie lorsque le courrier arrive et placées dans le sommaire du message (pour affichage dans les fenêtres de classeur et dans la zone de sujet éditable). Les changements subséquents de table de visualisation n'affecteront pas les sommaires. Pour le courrier MIME entrant, aucune conversion de ce genre n'est opérée, parce que le MIME a un mécanisme pour spécifier les jeux de caractères dans les noms et les sujets.

Ph et Index

Les requêtes Ph et Index subissent une conversion selon les tables prédéfinies par ailleurs (cf. ci-dessus).

Annexes

Les tables de conversion ne sont normalement pas utilisées lorsque vous envoyez ou recevez des annexes, à moins que ces annexes ne soient des documents de texte pur. Si les annexes sont des documents de texte pur, elles subiront une conversion si l'option "Toujours comme documents" est désactivée, ou si le type d'annexe "AppleDouble" est choisi.

Créer de nouvelles tables

Si vous essayez d'utiliser un jeu de caractères qu'Eudora ne comprend pas, vous pouvez construire des tables pour lui. Vous aurez besoin de créer deux ressources 'taBL', et probablement votre propre ressource 'euTM' également.

Choisir des identifiants de ressource (Resource Id's)

Vous avez besoin de choisir deux id de ressource pour vos tables. Ces id doivent être consécutifs, le nombre inférieur étant impair. L'id impair est utilisé pour le courrier entrant et l'id pair pour le courrier sortant. Afin d'éviter des conflits d'id, prenez le code pays du Macintosh, multipliez-le par 10 et ajoutez-y 2000, et ajoutez 1 si la table est pour le courrier entrant ou 2 si la table est pour le courrier sortant. Par exemple, la table qui cartographie l'ASCII suédois aux caractères du Macintosh est :

10*7 (7 est le code pays pour la Suède) + 2000 + 1 (puisque la table est utilisée pour recevoir du courrier), ou 2071.

Créer les ressources 'taBL'

Une fois que vous avez choisi les id, créez les ressources 'taBL'. L'éditeur général de ResEdit fonctionne assez bien pour les tables. Vous souhaiterez probablement copier l'id de ressource 'taBL' 1003 comme point de départ. De cette manière, vous n'aurez qu'à modifier les parties du jeu de caractères du Macintosh qui doivent subir une conversion. Les noms des ressources seront utilisés dans les menus, donc nommez les ressources de table de manière descriptive. C'est aussi une bonne idée de créer vos ressources dans un document ente; document de type 'rsrc' et de créateur 'CSOm'. De cette manière, les utilisateurs peuvent facilement installer et enlever votre table, et votre table ne sera pas effacée s'ils rehaussent leur copie d'Eudora ou des Tables d'Eudora.

Créer une ressource euTM

La ressource 'euTM' est utilisée pour nommer des jeux de caractères. Les jeux de caractères doivent être nommés de manière que les applications de courrier sachent quel jeu de caractère est utilisé. Les noms MIME officiels pour les jeux de caractères sont souvent très déplaisants. Par exemple, le nom pour un jeu de caractères suédois courant est "SEN_850200_B".

Partie d'une ressource euTM

La ressource 'euTM' est une liste d'id de ressource et de noms. Lorsqu'Eudora envoie du courrier, il soustraira 1 de l'id de ressource de la table, puis cherchera cet id de ressource dans toutes les ressources 'euTM' qu'il pourra trouver. Lorsqu'il trouve un id correspondant, le nom correspondant à l'id est utilisé.

Par exemple, un utilisateur choisissant la table Mac->se utiliserait l'id de table 2072. Eudora soustrait un, trouve 2071 dans la deuxième position dans la ressource 'euTM' et envoie le courrier avec un nom de jeu de caractères "SEN_850200_B".

Lorsqu'on reçoit du courrier, le processus est inversé; le nom du jeu de caractères est recherché, l'id de ressource trouvé et cette table de conversion est utilisée pour le courrier.

Pour votre table, vous devriez créer une ressource 'euTM', énumérer l'id de ressource de votre table (uniquement l'id impair) et le nom qui doit être utilisé dans le courrier pour ce jeu de caractères.

Retour à la table des matières


5 octobre 1996.
Version HTML : Jean-Pierre Kuypers