Subject: RE : [CSTIC] Propositions de termes pour une prochaine liste
From: "f2s" <f2s@de-solliers.fr>
Date: Sun, 10 Apr 2005 11:20:09 +0200
To: "'Etienne Quillot'" <etienne.quillot@culture.gouv.fr>, "'France LAFARGUE'" <france.lafargue@afnor.org>
CC: <cstic@dr.education.gouv.fr>
Comme mon premier envoi du samedi 9 avril ne semble pas être passé,
je tente une deuxième chance. En vous prions de bien vouloir m'excuser si
vous le recevez deux fois.
----------
Je peux vous proposer en réponse quelques éléments extraits de mon
dictionnaire d'informatique.
opt-in = abonnement volontaire
Le fait de choisir de participer : s'abonner, par exemple à une liste
d'abonnement, à un magazine électronique ou à une lettre d'information
électronique, sur Internet. Le consentement est implicite.
En pratique, l'internaute peut également cocher une case le prévenant
qu'outre l'abonnement, les informations personnelles qu'il fournit « peuvent
» servir au teneur du site à tous usages, même externes, ce qui équivaut en
réalité à une certitude, par exemple pour l'informer sur de nouveaux
produits puis lui envoyer des publicités provenant de tiers; libre à lui de
ne pas le faire. Par contre, une variété d'abonnement s'effectue sans
fournir d'adresse de messagerie, simplement en acceptant de la part de
l'internaute de recevoir un témoin, voir cookie.
C'est pourquoi la Commission Européenne a promulgué en novembre 2001 une
directive rendant ce procédé obligatoire à la place de l'accord implicite,
voir opt-out, ce qui distingue sur ce point l'Europe des États-Unis
d'Amérique.
Voyez par exemple la page (en américain)
www.bbbonline.org/UnderstandingPrivacy/library/
whitepapers/RetailCreditStudy.pdf (octobre 2003) On y trouve une longue
discussion juridique sur le sujet à partir de la page 15. Voir également le
site de CNN sur l'évolution de la question (avril 2002, en américain de
même) : http://www.cnn.com/2002/TECH/industry/04/25/senate.opt.in.idg/
Le tout indique bien le manque actuel de protection de l'internaute
outre-Atlantique.
opt-out = non abonnement
non abonnement à une liste, à un magazine électronique ou à une lettre
d'information électronique, sur Internet ou, éventuellement, désabonnement ;
variante : le fait de donner l'autorisation au propriétaire d'un site
d'enregistrer les données personnelles d'un individu et d'en faire usage par
la suite, y compris en relation avec d'autres entreprises, en clairs de les
diffuser au dehors. À l'origine, il devait être signifié de manière
explicite ; mais, suite à l'évolution des sociétés développées au début des
années 2000, le refus y est désormais implicite, présupposé ; normalement,
ceci permet alors à un individu de ne pas être fiché par le site en
question, sans nécessiter aucune action volontaire de sa part.
optical character recognition = reconnaissance optique de caractères,
lecture optique de caractères ; remarque : rien n'oblige à créer des
barbarismes en français ; LISO la définie comme la reconnaissance de
caractères employant un procédé optique pour identifier des caractères
graphiques.
Elle est précédée de la numérisation dun document pour en produire une
image en mode trame et suivie dune conversion en ASCII pour fournir un
texte utilisable par lordinateur ; elle nécessite au minimum un numériseur
et un logiciel spécialisé, au mieux un matériel spécialisé.
Attention à ne pas se laisser impressionner par un taux de reconnaissance
de 99,x % : il ne concerne que les caractères pris isolément ; ce qui compte
pour lutilisateur humain, ce sont les mots que doit reconnaître le
dictionnaire intégré dans certains logiciels ; alors, le taux descend à 90 %
net au mieux, soit au minimum une ou deux erreurs par page de 1 500
caractères, donc une phrase sur N est incompréhensible directement par le
système et nécessite une relecture humaine ; mais le taux effectif de
reconnaissance est souvent bien plus faible... Moralité : le travail complet
demande de numériser le document, de lancer le logiciel, puis de relire le
texte reconstitué proposé, bref il faut compter environ 1 à 2 minutes de
travail par page, dont 5 à 10 secondes pour la seule numérisation et le
reste pour la reconnaissance des caractères. Bon courage ! Ce qui fait dire
chez la société Xerox que ce n'est pas une science exacte...
Le principal problème est posé par les images sales, voir mangled : le
fait que deux caractères proches par la typographie peuvent être confondus
comme les « c » et « o » ou « b » et « h » minuscules, ou encore, en langage
américain des É-U, « n » et « m », « o » et « @ », « ! » et « l », « y » et
« j » en minuscules également ; voir scano. Variante : un texte numérisé de
biais crée des caractères déformés, voir skew ; en outre, cest bien pire
dans le cas des polices de caractères compliquées, alambiquées ou dites «
artistiques » et des télécopies ainsi que les productions des imprimantes
matricielles. Mais les caractères accentués posent également problème, les
polices de caractères rares comme le gothique encore plus.
Les critères dappréciation par les utilisateurs sont
1) la traduction la meilleure dun texte imprimé,
2) la rapidité de traitement,
3) la reconnaissance de texte imprimé en oblique,
4) laptitude à traiter des caractères minuscules,
5) l'aptitude à reconnaître les enrichissements typographiques : gras,
italique, souligné et caractères spéciaux,
6) l'aptitude à distinguer les figures et le texte, les colonnes de texte,
lorientation portrait ou paysage. Pour les plus exigeants, ajoutons :
7) les capacités dapprentissage, la conservation des justifications, le
fonctionnement en autonome et la richesse des nombres de formats de fichiers
dimages lus.
mind mapping = remue-méninges, traduction de " brain storming " ;
ceci a donc peu de rapport avec la « toile sémantique » alias Semantic Web :
littéralement le Web sémantique : projet d'extension apportée au Web, se
voulant aussi universel et décentralisé que possible et dans lequel les
données contenues dans les pages seraient compréhensibles par les machines
du point de vue sémantique, en plus des adresses URL ; il a été imaginé en
1999 ; ses créateurs Tim BERNERS-LEE, James HENDLER et Ora LASSILA le
décrivent comme une extension apportée au Web actuel dans laquelle les
informations reçoivent une signification bien définie, permettant une
meilleure collaboration entre les ordinateurs et les personnes.
Meilleures salutations.
Frédéric de SOLLIERS
traducteur informatique, lexicographe
membre de la Société Française des Traducteurs
--------------------------------------------
f2s@de-solliers.fr
http://www.de-solliers.fr
--------------------------------------------
-----Message d'origine-----
De : Etienne Quillot [mailto:etienne.quillot@culture.gouv.fr]
Envoyé : 8 avril 2005 16:32
À : France LAFARGUE
Cc : cstic@dr.education.gouv.fr
Objet : [CSTIC] Propositions de termes pour une prochaine liste
Chère France,
L'ordre du jour de la prochaine réunion de la CSTIC annonce l'achèvement de
la 5e liste de vocabulaire. Puis-je d'ors et déjà, par quelques suggestions,
devancer le traditionnel appel à proposition de termes à inclure dans le
programme de travail des prochaines réunions de la commission ?
- opt-in et opt-out (à propos du consentement à recevoir du courrier
électronique publicitaire) : nous avons déjà été interrogés par plusieurs de
nos interlocuteurs sans être en mesure de donner une réponse satisfaisante.
- optical character recognition (OCR) : on assiste actuellement à
l'apparition en français de nombreux dérivés peu transparents à partir d'OCR
(« océriser », « océrisation » ...), alors quon ne trouve pas une
dérivation semblable en anglais. Il y a semble-t-il également un usage de «
numérisation » et d'« alphanumérisation » dans le sens d« océrisation ».
Est-il possible de clarifier la situation ?
- enfin, le mind mapping, souvent traduit par « carte heuristique »,
relève-t-il de votre domaine de compétence ? Y a-t-il un rapport avec la «
toile sémantique » ?
Jai quelques autres termes en réserve mais je ne veux pas allonger
excessivement la liste : la commission doit aussi traiter les notions
écartées lors de létablissement du programme de travail il y a un an !
Avec toute mon amitié,
Etienne QUILLOT
Chargé du suivi des commissions de terminologie et de néologie
Délégation générale à la langue française et aux langues de France
6, rue des Pyramides
F_75001 Paris
Tél : 33 (0)1 40 15 36 01
Mél. : etienne.quillot@culture.gouv.fr
http://www.criter.dglflf.culture.gouv.fr