NOTICE
All files on this site have been moved to http://www.wikilivres.ca. All future contributions to Wikilivres should be made there.
This site will be closed on June 6th, 2012.
Traduction automatique
Free texts and images.
| Traduction automatique |
| Ce texte est issu d'anciennes version de la page de même nom publiée sur Wikipedia. La page de wikipedia ayant vu son contenu fortement tronqué au point de perdre beaucoup de son intérêt par un administrateur de ce site le 10 puis le 12 juin 2010, cette page reprend la version de la page juste avant cette suppression, sauf pour les chapitres Produits et services existants et Liens externes qui reprennent la version plus détaillée du 4 novembre 2008 de la page de Wikipedia.
Le but de la publication de cette page sur ce site (publication refusée sur wikisource) est de conserver sur le web le travail rédactionnel important réalisé au préalable sur wikipedia. |
La traduction automatique au sens courant
L'expression « traduction automatique » désigne au sens strict la traduction entière d'un texte (ou d'une conversation audio, en direct ou en différé) grâce à un ou plusieurs programmes informatiques, sans qu'un traducteur humain ait à intervenir[1].
« Un logiciel de traduction, lit-on dans Le Livre blanc de Softissimo prend toute sa valeur dans la mesure où il abaisse les barrières linguistiques : il permet non seulement de comprendre un texte écrit dans une langue qu'on ne maîtrise pas, mais surtout de le comprendre instantanément sans avoir à faire appel à une autre personne : un seul clic de souris permet d'appréhender immédiatement le sens d'un document exprimé dans une langue étrangère... »
Promt est évidemment du même avis et il fait valoir que la traduction automatique l'emporte sur de nombreux points par rapport à la traduction humaine : la vitesse, l'accessibilité, le coût, la confidentialité, l'objectivité, l'homogénéité, l'universalité. Elle suffirait largement « lorsque la perfection n'est pas nécessaire »[2] et de toutes façons, conclut sa publicité, « une traduction même très approximative est préférable à un texte totalement inintelligible dans une langue étrangère. »
Tous les chercheurs ne partagent pas cet optimisme. C'est ainsi que, sur une page du Centre Pluridisciplinaire de Sémiolinguistique Textuelle dépendant de l'Université Toulouse-Le Mirail, on peut lire l'opinion de M. Boitet, professeur à l'Université Joseph Fourier (Grenoble 1) ; sous le titre dépourvu d'ambiguïté Un aveu d'échec il écrit : « On sait désormais que la traduction automatique générale n'est pas viable », bien qu'il apporte une nuance : « mais on sait également quand la traduction automatique peut rendre de réels services ». C'est-à-dire, nous explique-t-il plus loin, dans des domaines très spéciaux avec un vocabulaire rigide qui ne peut se permettre aucune fantaisie. C'est le cas, par exemple, du système METEO, « système opérationnel pour la traduction automatique des bulletins météorologiques destinés au grand public », lancé de façon opérationnelle le 24 mai 1977. Son inventeur, John Chandioux, est cité comme exemple par M. Boitet dans Traduction automatique : ça marche ou non.
On voit au moins que la traduction automatique est encore très imparfaite, et que la génération de traductions d'une qualité comparable à celle de traducteurs humains relève encore de l'utopie.
Malgré ses faiblesses, elle peut rendre des services dans des domaines tels que la veille internationale (veille technologique y compris)[3], où elle permet de prendre connaissance de façon superficielle, mais rapidement de grandes quantités de textes.
La traduction automatique peut être d'ailleurs fort utile aux traducteurs eux-mêmes en leur suggérant des formules plus heureuses que celles qui leur étaient venues à l'esprit, en leur permettant d'établir des dictionnaires spécialisés dans des questions qu'ils ont souvent à traiter, et en les mettant en garde contre des erreurs qu'on peut toujours commettre dans une langue qui n'est pas la sienne ; mais il va de soi que le texte proposé, quand on ne se contente pas d'y jeter un simple coup d'œil d'information, est attentivement relu, comparé à l'original et corrigé chaque fois que c'est nécessaire. Mais il ne s'agit pas ici vraiment d'une traduction automatique mais d'une des formes de la traduction assistée, car une traduction peut être assistée de différentes façons : par un dictionnaire, par la relecture faite par un autre traducteur ou un spécialiste de la question, ou par un logiciel spécialisé. Jamais le traducteur principal n'abdique sa responsabilité, c'est à lui en définitive de choisir après avoir simplement reçu un conseil qu'il est libre de suivre ou non. Ce qu'on entend au contraire dans la langue courante par traduction automatique, c'est la reproduction brute du texte proposé par la machine sans se préoccuper de savoir s'il a un sens ou non.
Et il faut avouer que, depuis quelques années, cette façon de procéder connaît un essor considérable sur le Web, avec plusieurs systèmes en ligne qui prétendent traduire automatiquement et en quelques secondes des pages Web ou des textes de plus en plus longs. C'est une aide très appréciée du grand public, persuadé qu'il pourra ainsi déchiffrer – au moins de façon grossière - le thème d'une page Web dans une langue totalement inconnue, et les principaux faits ou éléments d'information qu'elle contient ; ou inversement faire passer le contenu d'un message dans une langue étrangère dont il ignore tout. Pour simplifier la navigation, plusieurs moteurs de recherche comme Google, Altavista ou Yahoo! permettent de l'utiliser. C'est cette traduction automatique, non revue par un traducteur compétent, qui est le sujet du présent article.
Prérequis
La traduction automatique nécessite :
- des règles grammaticales,
- des règles stylistiques,
- un dictionnaire et/ou une mémoire de traduction.
Difficultés
- Ambiguïtés lexicales : polysémie. Dans Le défi des Langues, Claude Piron raconte que le 4 mai 1991 il avait demandé à une machine de traduire: In such a case, you can make a very good case for wooden cases, c'est-à-dire: «En pareil cas, on peut produire une argumentation très convaincante en faveur des caisses en bois», phrase qu'il avait déjà lue et simplement condensée. Au bout d'un instant vint la réponse: «Dans un tel cas vous pouvez faire un très bon cas pour des cas inexpressifs». Il ne semble pas qu'on fasse mieux à l'heure actuelle[4].
- Ambiguïtés grammaticales : un même mot peut relever de deux catégories grammaticales différentes. Toujours dans Le Défi des Langues l'auteur proposait à une machine, mise en mode interactif, He was sorting out food rations and chewing gum, phrase qui peut signifier soit «il triait des rations et du chewing gum», soit «il triait des rations tout en mâchant du chewing-gum». Au lieu de poser une question sur la valeur grammaticale du -ing dans chewing, au lieu d'«interagir», la machine livra la phrase suivante: « Il triait dehors rations de nourriture et mastiquant la gencive.» On aurait aujourd'hui moins ridicule mais guère plus juste (Au 2008/02/10, le traducteur de Google donne : « Il était le tri des rations alimentaires et du chewing-gum »).
- Ambiguïtés sémantiques : selon le contexte, la traduction peut être différente. De même, les jeux de mots sont très difficiles à traduire (la poésie, ...). Il suffit de penser à la phrase: «They saw a tree» qui peut aussi bien signifier: «Ils ont vu un arbre» que «Ils scient un arbre». Dans le contexte personne ne s'y trompera, mais la machine n'en est pas à ce point.
Ajoutons que la machine elle-même est incapable de fournir une réponse là où le traducteur humain lui-même doit réfléchir ou se renseigner ; « his secretary » deviendra en français « son secrétaire » ou « sa secrétaire », suivant le sexe de l'employé(e), tandis que « son secrétaire » sera rendu en anglais par « his secretary » ou « her secretary » suivant le sexe de l'employeur(se). Pour que le programme soit capable de fournir une traduction correcte, il faut: - qu'il dispose, en plus de connaissances linguistiques, de connaissances factuelles sur l'état du monde (par exemple, il doit savoir que telle personne est de sexe féminin);
- qu'il soit capable de réaliser une certaine interprétation du texte qui lui est soumis: s'il rencontre le mot « secrétaire », il a besoin de savoir, selon la langue-cible, le sexe de ce/cette secrétaire ou de son employeur. Il est facile de résoudre cette difficulté dans le cas d'une phrase simple comme « John Doe's secretary »: une règle simple permet d'exprimer le fait que l'expression « X's Y » implique que Y appartient à X. Mais si le programme rencontre la phrase « je suis allé au service de la comptabilité et j'ai parlé au secrétaire », il est plus difficile pour la machine de faire la relation entre les secrétaires et le service qui vient d'être mentionné; la tâche est encore plus ardue dans un contexte comme « j'ai vu M. Tartempion, qui m'a donné un document, je suis allé au service de la comptabilité pour qu'ils en fassent une photocopie, et je suis revenu le donner à la secrétaire »: ici, on ne peut même pas s'appuyer sur la proximité entre le mot « secrétaire » et le nom du service, puisqu'il est en fait question de la secrétaire de Tartempion, mentionnée bien avant dans la phrase.
Quand on passe d'une langue germanique à une langue latine, on se rend compte de la difficulté que pose l'imparfait, temps qui marque en français la durée et l'inachèvement. Non que cette notion soit absente dans l'esprit des Germains, mais ils l'expriment d'une autre façon. Ainsi une phrase comme: A kingdom of Dacia was in existence at least as early as the beginning of the 2nd century BC sera rendue par:
- Un royaume de Dacia était en existence au moins dès le début du IIeme siècle av J.C.
alors qu'il suffirait de dire :
- Un royaume de Dacie existait au moins dès le début du IIeme siècle av J.C.
Un traducteur préférerait peut-être :
- «Dès le début du IIeme siècle av J.C, au moins, il existait un royaume de Dacie», mais nous n'en sommes pas là.
Les erreurs d'écriture : Les fautes d'orthographe, fautes de langue, même courantes, compliquent singulièrement la tâche des logiciels. Prenons l'exemple de : :Nous avons résolu le problème
N'importe quel logiciel donnera :
- We solved the problem
Mais on rencontre souvent des mots mal orthographiés, comme dans:
- On à résolut le problème
En combinant fautes d'orthographe et emploi populaire de « on » pour « nous », cela donnera quelque chose comme :
- One with solved the problem, phrase difficile à comprendre pour un anglophone.
Au vu du niveau orthographique et grammatical de certains articles sur Internet et, surtout, des forums de discussion, un étranger ne pourra donc se fier à un traducteur automatique.
Situation actuelle
Google a mis au point un nouveau système de traduction automatique présenté comme suit par Franz Och (research scientist) :
- "Most state-of-the-art commercial machine translation systems in use today have been developed using a rules-based approach and require a lot of work by linguists to define vocabularies and grammars. Several research systems, including ours, take a different approach: we feed the computer with billions of words of text, both monolingual text in the target language, and aligned text consisting of examples of human translations between the languages. We then apply statistical learning techniques to build a translation model".
Voici comment Google lui-même traduit le texte :
- « La plupart état de l'art des systèmes de traduction automatique commerciales en usage aujourd'hui ont été mis au point en utilisant une approche fondée sur les règles et nécessitent beaucoup de travail par des linguistes de définir des vocabulaires et les grammaires. Plusieurs systèmes de recherche, y compris la nôtre, adopter une approche différente : nous nourrir l'ordinateur avec des milliards de mots de texte, les deux textes monolingues dans la langue cible, et l'alignement de texte comprenant des exemples de traductions humaines entre les langues. Nous avons ensuite appliquer des techniques d'apprentissage statistique pour construire un modèle de la traduction. »
Malgré les fautes de français on comprend de quoi il s'agit, mais Systran s'en tire un peu mieux avec :
- « La plupart des systèmes de traduction automatique commerciaux du dernier cri en service aujourd'hui ont été développés en utilisant une approche règle-basée et exigent beaucoup de travail par des linguistes de définir des vocabulaires et des grammaires. Plusieurs recherchent des systèmes, y compris le nôtre, adoptent une approche différente : nous alimentons l'ordinateur avec des milliards de mots de texte, les deux texte monolingue dans la langue cible, et exemples se composants alignés des textes des traductions humaines entre les langues. Nous appliquons alors des techniques de étude statistiques pour établir un modèle de traduction ».
Ainsi que Promt :
- « La plupart des systèmes de traduction automatique commerciaux dernière génération dans l'utilisation ont aujourd'hui été développés en utilisant une approche à base de règles et exigent à beaucoup de travail par les linguistes de définir des vocabulaires et des grammaires. Plusieurs systèmes de recherche, en incluant le nôtre, prennent une différente approche : nous nourrissons l'ordinateur avec des milliards de mots de texte, tant texte monolingue dans la langue cible, que texte aligné nous composant des exemples de traductions humaines entre les langues. Nous appliquons alors des techniques d'apprentissage statistiques pour construire un modèle de traduction. »
Comme l'évoquait Claude Piron ; si toutes les phrases étaient du genre « My tailor is rich » la traduction ne poserait aucun problème. Qu'adviendra-t-il si un étudiant d'histoire, ignorant tout de l'allemand, tombe sur la phrase :
- Preußen (lat.: Borussia, Prussia oder Prutenia; poln. Prusy; russ.: Prussija) war ursprünglich das Gebiet des baltischen Volksstamms der Pruzzen, später eines der Länder des Deutschen Ordens und seit dem 16. Jahrhundert ein Herzogtum der Hohenzollern unter polnisch-litauischer Lehenshoheit, das seit 1618 in Personalunion mit der Mark Brandenburg verbunden war.
Quiconque a une teinture d'allemand et d'histoire comprendra tout de suite :
- À l'origine la Prusse (latin: Borussia, Prussia ou Prutenia; polonais: Prusy; russe: Prussija) était un territoire habité par une population balte: les Vieux-Prussiens. Par la suite elle devint une des possessions des Chevaliers Teutoniques ; au XVIeme siècle elle forma un duché vassal de l'État polono-lituanien et appartenant aux Hohenzollern, avant d'être liée en 1618 à la Marche de Brandebourg par une union personnelle.
Google propose :
- Prusse (en latin: Borussia, Prussia ou Prutenia; polonais Prusy; russe: Prussija) était à l'origine le territoire du pays baltes Volksstamms la Pruzzen, plus tard, l'un des pays de l'ordre et les Allemands depuis le 16 Un siècle de la Duché de Hohenzollern sous polnisch-litauischer fief de la souveraineté, qui, depuis 1618 en union personnelle avec le Mark Brandebourg était associé.[5]
Ce qui est loin d'être clair. Systran nous livre :
- La Prusse (lat.: Borussia, Prussia ou Prutenia; poln. Prusy; suie: Le Prussija) était à l'origine le secteur de la course balte des Pruzzen, plus tard un des pays du ordens allemand et depuis lesquelles 16. Siècle un duché des Hohenzollern sous des Lehenshoheit polnisch-litauischer qui a été lié depuis 1618 dans une union personnelle au mark au Brandebourg.
Ce qui est aussi énigmatique. Promt n'a pas l'air de faire mieux :
- Prusse (lat . : Borussia, Prussia ou Prutenia; poln. Prusy; russ . : Prussija), la région{zone} de la tribu baltique était initialement Pruzzen, plus tard l'un des pays de l'ordre allemand et depuis le XVIeme siècle un duché des Hohenzollern sous l'Altesse de fief polonaise lithuanienne qui était lié depuis 1618 dans l'union personnelle à Mark Brandenburg.
Il est vrai que, si nous munissons Promt d'un dictionnaire fabriqué par l'utilisateur lui-même et comportant le vocabulaire utilisé nous obtenons :
- Prusse (lat . : Borussia, Prussia ou Prutenia; poln. Prusy; russ . : Prussija), la région{zone} de la tribu baltique des Vieux-Prussiens, était initialement plus tard l'un des pays de l'Ordre teutonique et depuis le XVIeme siècle un duché des Hohenzollern sous la suzeraineté polono-lithuanienne qui était lié depuis 1618 dans l'union personnelle à la Marche de Brandebourg.
Et l'on arrive à voir tout de même de quoi il s'agit. Mais la création d'un tel dictionnaire demande du temps et elle ne peut être réalisée que par quelqu'un qui justement connaît déjà la langue.
les phrases équivoques posent aussi problèmes, avec une interprétation grammaticalement correcte et sémantiquement absurde. « Die Kuh melkt die Bäuerin » peut signifier aussi bien « La vache, c'est la paysanne qui la trait » que « La vache trait la paysanne ». Ici Google patauge (« La vache en train de traire la paysanne ») aussi bien que Promt (« La vache trayez la paysanne ») ; seul Systran s'en tire victorieusement avec : « L'agricultrice trait la vache ».
Google paraît donc un système de traduction aussi honorable que ses concurrents, mais sans supériorité décisive. Il ne manque pas de rappeler qu'il n'est qu'à ses débuts et qu'il est capable de progresser (un système permet maintenant à l'utilisateur de "« suggérer »" de meilleures traduction), mais ses concurrents se perfectionneront sans doute aussi.
Sensibilité au contexte
Certains logiciels devraient pouvoir trouver des solutions différentes selon le contexte, soit qu'on le leur indique, soit qu'ils le trouvent automatiquement. Cependant on a signalé le cas de « They saw a tree », dont les deux significations peuvent se retrouver dans un article consacré à la sylviculture. De même, dans un contexte religieux, « see » peut avoir le sens de « voir » comme celui de « siège » (épiscopal). Et, surtout, cette sensibilité au contexte est inefficace dans le cas d'ambiguïté grammaticale. Dans un texte sur Willy Stoph, on nous dit que ce politicien est-allemand fut capturé par les Russes en 1945 puis que...
- « Im Juli 1945 wird er aus der sowjetischen Kriegsgefangenschaft entlassen. »
Deux traductions possibles : « il est libéré de captivité » ou « il libérera de captivité » ; la première est tellement évidente que le lecteur n'imaginera même pas qu'une seconde est possible suivant la grammaire, mais la machine n'y verra pas finesse. Le logiciel A donnera la bonne solution, faut-il croire qu'il est plus élaboré que le logiciel B qui propose la seconde ? En fait il est plus probable que le choix s'est fait au hasard.
Demain on traduit gratis
Fin octobre 2005, la presse annonçait de notables améliorations [6]. Le Centre international pour les technologies avancées des communications, dirigé conjointement par l'université Carnegie Mellon de Pittsburgh et l' université de Karlsruhe en Allemagne, dévoilait alors un système informatique de traduction instantanée. Un étudiant chinois, affublé de onze électrodes sur le visage et sur la gorge, a prononcé dans sa langue un discours qui a été simultanément traduit en anglais et en espagnol. L'histoire ne dit pas si le discours avait été préparé, auquel cas les traductions auraient pu l'être aussi. On concède simplement que « Les résultats ne sont pas parfaits » et qu' « il peut y avoir des difficultés quelquefois ». En fait aucun article ne nous dit que les journalistes allemands et américains ont pu discuter avec le Chinois, ce qui aurait été la seule information intéressante. Les journalistes ont d'ailleurs généralement omis de préciser que, quand le docteur Waibel a annoncé qu'il allait prendre des questions de journalistes allemands et américains, l'ordinateur a entendu quelque chose comme : « Ainsi nous glycogène il alternant des questions entre l'Allemagne et l'Amérique. »[7]. Cet type de traduction demandera aussi des améliorations logicielle concernant la reconnaissance vocale, notamment brouillée par le bruit ambiant et la mauvaise prononciation.
Les appareils de traduction actuels sont utiles pour des situations limitées, par exemple pour réserver une chambre dans un hôtel. « Si je vais à Pékin, je peux descendre au Hilton sans aucun problème », disait Stephan Vogel, un chercheur de Carnegie Mellon. On peut penser que dans n'importe quel hôtel Hilton, en parlant anglais, il aurait eu encore moins de difficulté. Sans condamner une expérience qui peut réserver des surprises, on pourrait espérer des résultats plus tangibles.
Un échec significatif : le projet DLT
De 1979 à 1992 une firme néerlandaise a conçu et finalement abandonné un projet dit DLT (Traduction de langues distribuée).
Une idée du problème à résoudre est donnée par cet extrait d'un article allemand sur les mammouths de Colomb ; on nous dit de ces proboscidiens : « Ihre Kälber mussten sie gegen große Raubtiere verteidigen (Ils devaient défendre leurs petits contre les grands prédateurs) ». Alors que le lecteur allemand non seulement n'hésite pas sur le sens de la phrase mais qu'il ne lui vient même pas à l'idée qu'elle puisse en avoir un autre, un traducteur automatique doit se débattre entre vingt sens possibles puisque :
- Grammaticalement, « Kälber » et « sie » peuvent être tous les deux aussi bien sujets que compléments d'objet direct.
- « sie », en tant que complément d'objet direct peut se traduire aussi bien par « la » que par « les », et en tant que sujet par « ils » ou par « elles »
- Si « Kalb » a généralement le sens de « veau », les biologistes l'emploient pour désigner les petits d'autres animaux que les bovins mais, cette acception étant rare, les traducteurs automatiques ne la proposent pas
si bien qu'une machine pourrait aussi bien lire : « Ses veaux devaient la défendre contre les grands prédateurs. »
La troisième difficulté peut être résolue par l'emploi de logiciels sensibles au contexte, ou plus simplement par le choix avant la traduction d'un dictionnaire spécialisé, réservé à la biologie et où « Kalb » aurait le sens de « petit » ; on lui donnerait la priorité sur le vocabulaire ordinaire.
Pour la seconde difficulté on peut imaginer que la machine examinera la phrase précédente et cherchera s'il y a un nom féminin ou s'il y a un nom au pluriel et, si un seul de ces cas se présente, se décider d'après lui. Mais c'est bien hasardeux.
Pour la première difficulté, en revanche, on ne voit pas de solutions possibles aussi longtemps qu'une machine ne sera pas capable de savoir que ce sont les parents qui défendent leurs enfants et non l'inverse.
Voici comment s'y serait pris un logiciel, travaillant suivant le principe DLT. Travaillant en mode interactif, il aurait demandé la fonction grammaticale de « Kälber » et de « sie » et se serait informé sur le genre et le nombre de ce dernier. Il aurait pu enfin souhaiter une précision sur le sens du mot « Kalb ». Après avoir obtenu tous les renseignements nécessaires, il aurait traduit la phrase dans un langage spécial (en l'occurrence il s'agissait d'une forme d'espéranto adapté à la situation) et dont le sens aurait été absolument univoque. Sur cette base il était possible de demander immédiatement la traduction d'un long texte dans n'importe laquelle des langues européennes et obtenir le résultat immédiatement.
On faisait valoir pour un tel projet deux avantages qui paraissaient décisifs.
- Les traducteurs devenaient inutiles : il suffisait d'employer une secrétaire qui n'avait besoin de savoir que la langue source.
- Dans les institutions européennes les traductions devenaient immédiatement disponibles en même temps dans toutes les langues, fussent-elles très minoritaires.
L'abandon du projet a déçu bien des gens, surtout dans les milieux espérantistes qui suivaient l'affaire avec sympathie. Voici comment on peut tenter de l'expliquer :
- Le dialogue avec le logiciel exigerait des connaissances grammaticales aussi étendues que solides, qui ne sont plus acquises via le système scolaire. L'opérateur de traduction devrait donc être payé plus que la simple secrétaire trilingue dont on croyait faire l'économie.
- Le temps nécessaire pour répondre aux questions est un handicap. Dans le cas de la phrase sur le Mammouth de Colomb, un traducteur moyennement doué la comprendra sur-le-champ, et le temps de la traduction ne sera pas plus long que les quelques secondes nécessaires pour la dactylographier.
- L'avantage du système DLT est évidemment quand une traduction multilingue est nécessaire, mais il est rare qu'une entreprise privée ait à faire traduire un texte en plus d'une langue.
Exemples de risques de la traduction automatique : la négation dans les langues germaniques
Même celui qui connaît la langue peut avoir recours à un logiciel de traduction automatique pour diverses raisons :
- Certains offrent la possibilité de se constituer une base de vocabulaire où on peut stocker les nouveaux mots que l'on rencontre dans des domaines où l'on n'est pas familier.
- Il arrive que le logiciel propose un mot ou une tournure qui n'était pas venu à l'esprit.
- Parfois, pour un texte simple, on peut être tenté de se contenter d'une simple rectification de détails qui prendra moins de temps. C'est le cas lorsqu'on est amené à corriger un texte et qu'on s'aperçoit qu'il s'agit d'une traduction automatique plus ou moins revue.
Mais si l'on regarde trop distraitement l'original, on risque de ne pas remarquer une erreur. Le cas est flagrant pour les négations qu'on rencontre en néerlandais ou en allemand. Prenons le cas d'un article écrit dans la première langue et parlant du roi Louis Ier de Hollande, on nous dit de ce souverain, mis sur le trône contre la volonté du peuple :
- Il s'est toutefois contenté de la résignation, mais n'a pas tenté la sympathie de la nation gagner effectivement et son autorité justifier.
Une rectification rapide donnera :
- La résignation du peuple lui suffit: il ne tâcha pas de gagner sa sympathie et de justifier ainsi son autorité.
Seulement, si nous lisons l'original nous trouvons:
- Hij nam echter geen genoegen met de gelatenheid, maar poogde daadwerkelijk de sympathie van het volk te winnen en zijn gezag te rechtvaardigen.
C'est-à-dire exactement le contraire: la résignation de son peuple ne lui a pas suffi mais il a voulu gagner sa sympathie.
Encore l'erreur est-elle corrigeable car tout le reste du texte va contre cette phrase et on s'en apercevra à la relecture. Mais qu'on voie maintenant cette précision donnée sur le musicien Franz Liszt :
- Gleichwohl wurde bei Liszts, die der slowakischen Minderheit in Ungarn angehörten, zu Hause nur Slowakisch gesprochen.
La traduction donne :
- Même bien portant, on slovaque parlait à Liszts, qui appartenaient à la minorité slovaque en Hongrie, à la maison seulement.
La première erreur est grossière, mais il suffit d'entrer gleichwohl dans le vocabulaire avec sa traduction et désormais on trouvera néanmoins. Mais même ainsi on serait tenté de corriger en :
- Néanmoins chez les Liszt, qui appartenaient à la minorité slovaque, on parlait le slovaque mais seulement à la maison.
Alors qu'il faut dire, bien sûr :
- Néanmoins chez les Liszt, qui appartenaient à la minorité slovaque, on ne parlait que le slovaque à la maison.
Le faux sens est ici plus dangereux que le contresens vu précédemment car il peut ne pas être remarqué. Un traducteur automatique peut donc être un instrument « dangereux » entre les mains de ceux qui ne connaissent pas la langue... et c'est justement à eux qu'on le propose.
Le bon usage du traducteur automatique
Apprendre à rédiger
Ce qui précède avait pour but de mettre en garde contre la croyance naïve que tous les problèmes sont déjà résolus : il en subsiste et pour certains on ne voit pas encore comment en venir à bout, même si l'ingéniosité humaine finira probablement par le faire. Ces réserves faites, on doit se rendre compte que les traducteurs automatiques sont déjà à même de rendre de grands services dans la mesure où on connaît leurs limites et on sait ce qu'il est possible de leur demander, c'est-à-dire si on les emploie correctement.
Prenons en effet la phrase néerlandaise traduite avec un contresens :
- Hij nam echter geen genoegen met de gelatenheid, maar poogde daadwerkelijk de sympathie van het volk te winnen en zijn gezag te rechtvaardigen.
Nous avons vu qu'elle signifie :
- La résignation ne lui suffit pas, il voulut effectivement gagner la sympathie du peuple et justifier de cette manière son autorité
Alors qu'un logiciel donnait exactement l'idée opposée :
- 'Il s'est toutefois contenté de la résignation, mais n'a pas tenté la sympathie de la nation gagner effectivement et son autorité justifier.
Reprenons la phrase néerlandaise et remplaçons simplement la conjonction « maar » par un point-virgule en répétant le pronom sujet « hij ». Nous obtenons alors :
- Il ne s'est pas toutefois contenté de la résignation ; il a tenté gagner effectivement la sympathie de la nation et son autorité justifier.
Ce qui est un style maladroit mais tout à fait correct quant au sens. Que s'est-il passé ? Sachant que quand, dans une langue germanique, une idée négative précède une idée positive dans la même phrase, la négation a tendance à se reporter de la première sur la deuxième, nous les avons séparées en deux phrases différentes.
Revenons maintenant à la phrase allemande : elle est encore plus compliquée avec une subordonnée relative incluse dans la principale, et un participe passé rejeté tout à la fin. C'est trop pour un honnête logiciel et on comprend qu'il n'y arrive pas. Là encore il convient de morceler le tout en deux phrases distinctes, commençant par le sujet et à la forme active si possible. Ainsi :
- Gleichwohl wurde bei Liszts, die der slowakischen Minderheit in Ungarn angehörten, zu Hause nur Slowakisch gesprochen
se transforme en :
- Die Liszts gehörten gleichwohl der slowakischen Minderheit in Ungarn an, und man sprach bei ihnen zu Hause nur Slowakisch
certes moins élégant mais offrant moins de difficulté au logiciel qui nous donnera comme solution :
- Le Liszts appartenaient néanmoins à la minorité slovaque en Hongrie, et on parlait seulement Slovaque chez eux à la maison.
Celui qui sait que ce qu'il écrit fera l'objet d'une traduction automatique doit donc s'efforcer d'acquérir un style adapté. Dans de telles conditions on imagine fort bien deux sociétés ou deux personnes privées correspondant par traduction automatique alors que chacun ignore la langue de l'autre : un peu de bonne volonté de chaque côté sera suffisant.
Produits et services existants
Traducteurs en ligne gratuits
Ils permettent de traduire des mots ou des textes de taille limitée.
Langues généralement accessibles à la traduction : Allemand, Anglais, Espagnol, Français, Grec, Italien, Néerlandais, Portugais.
On trouve aussi pour des traductions avec l'anglais : Arabe, Chinois traditionnel, Chinois simplifié, Coréen, Espéranto, Japonais, Russe, Suédois
| Traducteur | Langues depuis ou vers le français | Langues depuis ou vers l'anglais | Limitation taille des textes | Autre |
|---|---|---|---|---|
| Systran | allemand, anglais, espagnol, grec moderne, italien, néerlandais, portugais | 13 langues | Limité aux petits textes | |
| Traduku | aucune | esperanto | Accepte les gros textes | |
| Apertium | espagnol, catalan, breton vers le français | catalan, espagnol, esperanto, galicien | Accepte les gros textes | D'autres langues dont Esperanto depuis ou vers l'Espagnol et le Catalan |
| Apertium espéranto | Français vers l'espéranto | Anglais depuis et vers l'esperanto | Accepte les gros textes | Ce lien est donné en plus du précédent qui ne fournit pas le choix du français vers l'espéranto |
| 57 autres langues début 2011 | idem | Accepte les gros textes | Jusqu'en mai 2008, ce traducteur ne supportait que 2 langues depuis/vers le français et 13 depuis/vers l'anglais. Actuellement, la traduction se fait de n'importe quelle des langues disponibles dans une autre, mais google passe par l'anglais, ce qui influe sur la qualité du résultat. | |
| Reverso | allemand, anglais, espagnol, italien, portugais, russe, japonais, hébreu, arabe | Les même avec chinois à la place de japonais. Interface utilisateur en anglais. | Limité aux petits textes | |
| Worldlingo | 32 langues en tout début 2011 | Mêmes langues | Limité à 500 mots | Payant au delà des 500 mots |
| Translated | Plus de 80 langues | Mêmes langues | Les limitations semblent dépendre de la paire de langues choisie | Payant pour les pages web. Dictionnaires spécialisés disponibles |
| Omnilang | 29 langues | 29 langues | Pages web seulement | Propose un ou plusieurs traducteurs en fonction du couple de langues choisi |
| Babelfish | allemand, anglais, espagnol, grec, italien, néerlandais, portugais | Les mêmes + russe, chinois, coréeen, japonais | Limité aux petits textes | Technologie SYSTRAN |
| Free | allemand, anglais, espagnol, grec, italien, néerlandais, portugais | Les mêmes + russe | Limité aux petits textes | Technologie SYSTRAN |
| Online translator | allemand, anglais, espagnol, italien, portugais, russe | allemand, espagnol, français, italien, portugais, russe | Textes limités à 500 mots | Technologie PROMT |
| Voila | allemand, anglais, espagnol, russe | allemand, espagnol, français, italien, portugais | Textes limités à 300 caractères | Technologie SYSTRAN |
| Amikai (lien cassé) | Allemand, Anglais, Italien | 8 langues | Limitée à 100 caractères | Traduction directe entre Japonais et Coréen |
| EZ2Find (lien cassé) | Allemand, Anglais, Espagnol, Italien, Néerlandais, Portugais | 11 langues | Textes limités à 150 mots | Technologie SYSTRAN |
Logiciels libres
Logiciels commerciaux
- SYSTRAN : Logiciel de traduction essentiellement pour Windows.
- PROMT : logiciel de traduction automatique créé en Russie
- REVERSO : logiciel de traduction automatique fourni par Softissimo
- TRANSLATED : logiciel de traduction automatique créé en Italie
Autres
- Projet MU
- Système METEO
- Extension FoxLingo pour Firefox, fondée sur le recensement des traducteurs gratuits en ligne
Prospective
Divers projets cherchent à améliorer les performances et la rapidité des moteurs de traduction, espérant un jour pouvoir surmonter la barrière de la langue et traduire en temps réel (comme cela a été imaginé par de nombreux auteurs de science-fiction) une langue étrangère, voir pouvoir « communiquer » avec certains animaux via un logiciel de traitement vocal.
- Un projet en cours au Japon consiste à équiper un téléphone portable d'un traducteur multilingue automatique [8]. Ce projet vise dans un premier temps à afficher sur l'écran du téléphone la traduction de phrases et mots simples prononcées en Japonais ou en d'autres langues, en quelques secondes et de manière autonome, c'est-à-dire sans dépendre d'un serveur [9].
- Google a annoncé début 2010 une application de traduction vocale quasi-instantanée (speech-to-speech translation)[10]
Liens externes
- http://www.cogs.susx.ac.uk/lab/nlp/gazdar/teach/nlp/nlpnode1.html#SECTION00010000000000000000
- http://www.cati.paris4.sorbonne.fr/cours/dea/dea_man413/tao/sommaire.php Exposé de DEA
- http://www.guilde.net/fr/newtrad.htm Concernant la traduction instantanée par électrodes
- Google et la traduction automatique
Bibliographie
- Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Machine Translation: An Introductory Guide.
- Paul Bennett. 1994. Translation Units in Human and Machine. Babel 40:12-20.
- Bert Esselink. 1998. A practical guide to software localization. John Benjamins.
- Ethnologue. 2001. Languages of the World.
- W. John Hutchins & Harold L. Somers. 1992.An Introduction to Machine Translation. Academic Press.
- W.John Hutchins. 2001. Machine translation over fifty years. Histoire, Epistemologie, Langage XXII-1:7-31.
- Martin Kay. 1997. The Proper Place of Men and Machines in Language Translation. Machine Translation 13:3-23.
- Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins .
- Sergei Nirenburg. 1987. Machine Translation: Theoretical and Methodological Issues. Cambridge University Press.
- Johnatan Slocum. 1988. Machine Translation Systems. Cambridge University Press.
Notes et références
- ↑ Il ne faut donc pas la confondre avec la traduction assistée par ordinateur où la traduction peut se faire en partie automatiquement et en partie de façon interactive avec la machine. Celle-ci pose alors des questions ou attend des précisions auxquelles ne peuvent répondre ceux qui ignorent tout de l'affaire.
- ↑ Comparaison entre la traduction machine et la traduction humaine
- ↑ Laurence Danlos. Professeur de Linguistique Informatique à l'Université Paris 7, écrit dans Linguistique informatique, Traduction automatique : « Ils produisent souvent des traductions erronées mais qui peuvent au moins servir à déterminer de quoi parle le texte (ce qui est important en veille technologique, par exemple). »
- ↑ Promt et Systran traduisent aujourd'hui « wooden » par « de bois » ou « en bois » et Google va même jusqu'à parler de « caisses en bois ». Seulement c'est en rendant désormais « wooden » par « en bois » dans tous les cas ; or, si l'on s'aventure à demander : « Her voice was wooden (Sa voix était inexpressive) », Google et Systran répondent avec un bel ensemble : « Sa voix était en bois » et Promt : « Sa voix était de bois ». On voit qu'on ne s'en sort pas facilement.
- ↑ Nous avons ici une illustration de la rapidité avec laquelle les choses évoluent. Au 26 octobre Google nous proposait : Prusse (en latin: Borussia, Prussia ou Prutenia; Polonais ancienne; Russe: Prussija) était à l'origine le territoire du pays baltes Chinoise de l'exilé, plus tard, l'un des pays de l'ordre et les Allemands depuis le 16 Un siècle, le duché de Hohenzollern sous polnisch-litauischer fief de la souveraineté, qui, depuis 1618 en union personnelle avec le Mark Brandenburg connecté. Deux mois plus tard on constate une certaine amélioration, avec surtout la disparition de l'étrange et pittoresque Chinoise de l'exilé. Le logiciel a préféré ne pas traduire ce qu'il ne comprenait pas.
- ↑ De nouveaux systèmes de traduction pour surmonter la barrière de la langue
- ↑ Une machine de traduction simultanée. L'information date du 31 octobre 2005 et, depuis, le projet semble en sommeil.
- ↑ Brève d'ADIT-Japon sur la traduction automatique du japonais par un téléphone mobile (projet de NEC Corporation annoncé début 2009)
- ↑ Article de akihabaranews (description d'un essai au C&C iEXPO 09)
- ↑ Article, intitulé Google leaps language barrier with translator phone Google prépare une application (pour téléphone) de traduction vocale instantanée (Sunday Times du 2010/02/07, consulté 2010/02/11)