TiLT

Article dans le revue TAL :

J.Heinecke, G.Smits, C.Chardenon, E.G. De Neef, E.Maillebuau, M.Boualem

TiLT : une plateforme pour le traitement automatique du langage naturel

Revue TAL, Volume 49, no 2/2008.

RÉSUMÉ

Cet article décrit une plate-forme de TALN, modulaire et multilingue, enrichie d’un système de contrôle basé sur l’aide multicritère à la décision. La présentation est complétée par une description des données linguistiques utilisées ainsi que des applications basées sur cette technologie.France Télécom mène des activités de R&D sur le traitement automatique des langues depuis près de deux décennies. Les travaux sur le traitement du langage naturel écrit sont menés notamment au sein de l’équipe Langues Naturelles de Orange Labs. Compte tenu de la dimension internationale de France Télécom et de la popularisation, de plus en plus croissante, des moyens de communication, faciliter le traitement et l’accès à l’information dans un grand nombre de langues revêt un intérêt particulier dans les activités de R&D. Les solutions liées au traitement automatique des langues naturelles sont ainsi mises à la disposition des utilisateurs (accès aux annuaires et aux bases de données, recherche d’information, etc.). Pour répondre aux besoins en matière d’accès à l’information, une plate-forme industrielle de TALN, baptisée TiLT (traitement linguistique des textes), a été mise en place à Orange Labs. Cet article est orienté vers une approche descriptive de TiLT qui tente d’en souligner un certain nombre de caractéristiques liées aux problématiques architecturales et méthodologiques. Il est à noter que cette description concerne essentiellement l’analyse linguistique et n’aborde que très sobrement la génération. Après avoir présenté les choix architecturaux, les différents modules de la plate-forme et les ressources linguistiques nécessaires à son fonctionnement, nous nous intéressons à l’interopérabilité des différents composants à travers le prisme du contrôle des processus d’analyse linguistique réalisables par la plate-forme. Enfin, nous terminons par une présentation des applications opérationnelles utilisant TiLT.

MOTS-CLÉS

Boîte à outils TALN, architecture modulaire et symbolique, analyse lexicale, syntaxique et sémantique, ontologies, multilinguisme, aide multicritère à la décision, ressources linguistiques riches, indépendance données/traitements.