Inventaire
Site en anglais
MERTEN Pascaline



Unités

TRADITAL : Centre de recherche en Traduction, interprétation, didactique et traitement automatique des langues

Le centre TRADITAL  regroupe des chercheurs issus des trois départements de la Faculté de lettres, traduction et communication.
Tradital se définit comme un centre de recherche en traduction, interprétation, didactique et traitement automatique des langues. Les activités de recherche se développent autour de trois axes principaux, envisagés dans leur dimension transversale : 
    • traductologie et interprétologie ; 
    • didactique des langues, cultures et littératures ; 
    • ingénierie des langues et aides à la traduction. 
En traductologie, les intentions de recherche visent l’étude et la modélisation de la compétence, des stratégies et des procédés de traduction, le contrôle de la qualité et la traduction littéraire. Le champ de l’interprétologie vise, de manière générale, l’étude et la modélisation des diverses formes d’interprétation, ainsi que l’étude des processus cognitifs en jeu. Les nouveaux défis, sociaux et technologiques, de l’interprétation ouvrent, en outre, d’intéressantes perspectives de recherches appliquées.
L’axe de la didactique des langues, cultures et littératures vise des questions épistémologiques et méthodologiques en didactique des langues française et étrangères, en didactique des cultures et de l’interculturel en langues étrangères et en didactique des littératures en langues étrangères.
Finalement, l’axe de l’ingénierie linguistique, envisagée dans une perspective multilingue, comme au service de la traduction, couvre des recherches sur le traitement automatique des langues, sur la linguistique de corpus et sur la constitution de bases de données lexicales et sémantiques.
Le centre Tradital organise régulièrement des Midis de la recherche qui peuvent prendre la forme d’un séminaire, d’une disputatio ou encore d’une formation aux outils de la recherche. Les doctorants sont invités à présenter un aspect de leur recherche en présence d’un discutant extérieur.
Le Centre de recherche Termisti, issu de l'Institut supérieur de traducteurs et interprètes (ISTI), a servi de noyau fondateur au centre Tradital, qu'il intègre comme groupe de recherche.

Projets

Les expressions régulières en traitement automatique des langues

Une expression régulière est une chaine de caractères (pattern en anglais), qui représente une classe de chaines de caractères. Ainsi, l’expression « d{2}-d{2}-d{4} » représente n’importe quelle date du type 11-05-2024 ou 07-12-2023. L’expression « ^[^s@]+@[^s@]+.[^s@]+$ » permet de vérifier la validité d’une adresse mail. Ces expressions régulières, regular expressions en anglais, REGEX en abrégé, sont disponibles dans de nombreux outils utilisés en traduction et en traitement automatique des langues, du traitement de texte aux mémoires de traduction et sont, bien sûr, prises en charge par les langages de programmation comme Python.

Souvent ignorées ou mal maitrisées, elles facilitent la révision, dans le traitement de texte ou dans l’environnement de traduction (par exemple pour transformer des dates comme dans l’exemple ci-dessus ou pour vérifier la présence ou l’absence d’espace (éventuellement insécables) devant un nombre. En programmation web, elles sont utilisées pour vérifier la conformité d’une adresse mail ou pour filtrer des adresses mail ou URL susceptibles d’être frauduleuses. En TAL, elles permettent d’effectuer des recherches (et remplacements) pointues tant sur des formes (« tous les adverbes en -ment ou -mment ») que sur des structures syntaxiques (« tous les syntagmes nominaux où deux adjectifs précèdent le nom »). Elles constituent ainsi la base du TAL. En traduction, elles permettent de paramétrer le système de mémoire de traduction pour qu’il prenne en charge des fichiers non standards. Alternativement, elles permettent de convertir un fichier d’un format vers un autre, de masquer en une fois toutes les chaines de caractères à ne pas traduire ou d’en extraire des informations pertinentes. Bien utilisées, elles évitent de fastidieuses et longues heures de préparation de fichiers, de révision ou de modifications ponctuelles.

L’objet de cette recherche est de décrire les emplois que l’on peut faire des REGEX, dans les diverses activités liées à la traduction : traduction, préparation de fichiers, révision, gestion de corpus, programmation Python pour le TAL et dans différents outils : traitement et éditeur de texte, mémoires de traduction, corpus, Python.

L’objectif est de fournir aux professionnels de la traduction et du TAL un panorama de la syntaxe des REGEX et de leur utilisation dans les différents outils à leur disposition. Cette description se veut pratique, pédagogique et riche d’exemples concrets.