Expériences de traduction ...
Blog de Michel Politis, Professeur au Département de Langues Étrangères, de Traduction et d'Interprétation de l'Université ionienne (Corfou - Grèce)

Σάββατο 28 Ιανουαρίου 2012

Littré : version interrogeable en ligne du dictionnaire de la langue française d'Émile Littré.

Bienvenue sur le site de XMLittré
Ce site propose une version interrogeable en ligne du dictionnaire de la langue française d'Émile Littré.
Cet ouvrage a été publié à partir de 1863, puis dans sa deuxième édition en 1872-1877.
Cette page-ci a été rédigée par moi-même, en guise d'introduction. Le reste du site est presque uniquement composé de textes rédigés par Émile Littré et ses collaborateurs, textes aujourd'hui tombés dans le domaine public. Contactez-moi si le source XML vous intéresse.
À la différence d'ouvrages purement explicatifs, ce dictionnaire est très littéraire, truffé de citations de toutes sortes et de toutes époques, et agrémenté de conseils d'utilisation ou de réprimandes aux auteurs trop irrévérencieux envers la langue française.
Une version hors-ligne est désormais disponible. Elle permet d'installer XMLittré sur son ordinateur et ainsi d'interroger le Littré sans accéder à internet.
Mises en garde :
  • Le dictionnaire peut contenir des erreurs liées au traitement automatisé qu'il a subi, comme un balisage fautif de citations. Merci de les signaler.
  • Les rubriques d'étymologie ont été conservées, mais leur contenu est souvent fantaisiste. Cette discipline était alors balbutiante.
Le contenu du site :
  • Recherche de mots : Bien sûr !
    Remarques :
    • Si le mot à rechercher n'est pas précisé, une entrée sera choisie au hasard.
    • Le moteur de recherche accepte les mots incomplets ou non accentués : « se prélasser », « prélasser » et « prelass » renvoient tous trois au même mot du dictionnaire. La casse de la requête est également indifférente (au sens premier de cet adjectif). Les formes fléchies sont désormais reconnues, comme « prélassâtes » ou « cristaux ».
    • Dans les citations, laisser le pointeur sur un nom d'auteur pour afficher son nom complet (si votre navigateur le permet).
  • Notice explicative : À défaut d'alphabet phonétique, le dictionnaire utilise sa propre représentation de la prononciation, décrite ici par Émile Littré. Les diverses abréviations y sont aussi présentées.
  • Liste des auteurs et des œuvres : Monsieur Littré propose dans son ouvrage une liste succincte des auteurs et des œuvres qu'il cite.
  • Annexes :
  • Passages remarquables : Une page de florilège propose quelques morceaux choisis par les usagers du site.
Quelques mots techniques sur le projet :
  • HTML : Ici, pas d'applet java, de flash ou autre suppôt de Belzébuth. Tous les navigateurs peuvent entrer, même en mode texte. Un bon navigateur est cependant recommandé : Opera ou, à défaut, un des enfants naturels de Mozilla, comme Firefox. Sous MacOS X, Safari est, paraît-il, excellent. Une version pas trop ancienne permet d'afficher dynamiquement le nom complet de l'auteur d'une citation. Le site respecte le standard HTML4.
  • CSS : La présentation des pages web est séparée du contenu en utilisant des feuilles de style au format CSS. Ce principe permet de modifier aisément le formatage de l'information. Certains excellents navigateurs peuvent même, à la demande, imposer leur propre style.
  • XML : Les définitions sont stockées au format XML et pèsent plus de 90 Mo répartis dans 26 fichiers inégaux.
  • PERL : Pour convertir le texte brut en texte structuré (repérer les citations, les paragraphes, et caetera), il a fallu près de 3000 lignes de code en perl. Avec de magnifiques expressions régulières !
  • PHP : L'interface web est réalisée en php4, tout comme la transformation à la volée du source XML en code HTML. Le php est un très bon outil, d'ailleurs fortement inspiré de Perl.
  • XSLT : Eh bien non ! L'essai n'a pas été concluant. Si XSLT avait été souple ou performant...
  • Morphalou : Les formes fléchies proviennent d'un lexique appelé Morphalou, dans sa version 1.0.1, et librement accessible.
  • Linux : C'est grâce à ce système d'exploitation stable et aux nombreux outils qui l'accompagnent (de la ligne de commande du shell à GNU Emacs en passant par vi et ses macros) que ce projet a pu être mené à bien de façon efficace et sans plantage intempestif. Donc un grand merci au logiciel libre.
Quelques statistiques :
  • 78 423 entrées
  • 293 009 citations, réparties en :
    • 36 431 sans auteur explicite
    • 17 977 de Voltaire
    • 12 606 de Bossuet
    • 11 484 de Corneille
    • 10 745 de Racine
    • 9 667 de Madame de Sévigné
    • 8 459 de Molière
    • 8 208 de Montaigne
    • 6 935 de La Fontaine
    • 6 262 de Amyot
    • 4 780 de Boileau
    • ...
  • 3 910 auteurs cités
XMLittré a été fait à deux : Guillaume et moi. Guillaume-sempai m'a guidé, et une fois la conception du projet effectuée en commun, j'ai écrit l'essentiel du code perl, puis php, etc.
Merci à tous les internautes qui m'ont aidé à améliorer le dictionnaire, en particulier pour les versions hors ligne. 


Source :  http://francois.gannaz.free.fr/Littre/accueil.php

Δεν υπάρχουν σχόλια: