Livre blanc GRIIIL (2005)

Source :

Le traitement automatique des langues dans les industries de l’information

Livre blanc
Groupe de Réflexion su les Industries de l’Information et les Industries de la Langue
(GRIIIL)
Janvier 2005

9099455310a24fb4483401e66b0de8832a843895

Introduction
Le propre de l’homme, au delà du rire, est bien d’avoir une capacité intellectuelle qui se déploie depuis des millénaires via les langues dites «naturelles». Le langage se retrouve aujourd’hui au cœur de tous les systèmes d’information : sous forme orale quand il s’agit du téléphone, ou écrite pour le mail, les fichiers ou encore le Web. Or la compétition sans cesse croissante des entreprises et des organisations pose la question de l’usage du «lange naturel» au sein des systèmes d’information comme une source de productivité potentielle. Aussi, la diversité à la fois de forme mais aussi de fond donne lieu à un challenge fantastique : faire en sorte que la faculté de langage soit prolongée au sein des machines. C’est un défi technologique qui vise à apporter des réponses concrètes à la gestion sans cesse croissante de textes, documents, mails, productions sonores et vidéo. Comment fournir cette convergence concernant le langage que chacun attend à travers des besoins aussi divers que : rechercher, classer, analyser, diffuser, reproduire, vérifier… ?
Le Traitement automatique des Langues (TAL) fédère un ensemble d’acteurs visant à mutualiser les avancées et les capacités des systèmes d’information, dont l’objet est d’apporter un service pour le traitement de l’information non structurée. Or, l’information issue du langage étant présente dans de nombreux systèmes d’information, sans exclusive quant au secteur d’activité c’est fort logiquement que les technologies embarquées sont utilisées dans de nombreux secteurs de l’activité des entreprises. Ces technologies sont également présentes, de manière grandissante, et sans être toujours évidentes pour l’utilisateur, dans divers systèmes grands public.
Ce document a pour vocation de fournir aux décideurs qui sont confrontés à une problématique liée à la gestion de l’information des clés de compréhension pour établir en quoi et pour quels usages les technologies du traitement automatique des langues sont utiles et pertinentes.
Le présent document est décomposé en trois grandes parties. La première établit un panorama de l’usage du traitement automatique des langues aujourd’hui, que ce soit dans les entreprises, dans les services embarqués ou pour les professionnels du domaine. La seconde partie déroule des applications concrètes et instanciées des technologies au sein des entreprises, en donnant, pour chacune d’elles, un exemple concret et une métrique permettant d’évaluer le bien fondé de l’utilisation du TAL dans un projet de ce type. C’est une grille de lecture à la fois didactique et discriminante qui permet à un chef de projet, décideur ou consultant, de mesurer l’impact du traitement automatique des langues, dans des contextes variés. Enfin, la troisième partie traite des standards qui émergent autour du TAL, notamment le Web Sémantique, afin de coordonner les efforts des industriels mais également des utilisateurs et des chercheurs.
Ce document se veut d’un usage pratique et pragmatique dans un contexte
opérationnel. Le TAL qui fête bientôt ses trente ans a l’âge de raison qui permet un tel tour d’horizon sur le chemin accompli et celui qui s’ouvre à lui.

Malek Boualem