{"id":122,"date":"2013-04-13T18:09:06","date_gmt":"2013-04-13T17:09:06","guid":{"rendered":"http:\/\/www.malek-boualem.fr\/info\/?page_id=122"},"modified":"2015-05-05T19:13:04","modified_gmt":"2015-05-05T18:13:04","slug":"definition-du-taln","status":"publish","type":"page","link":"https:\/\/www.malek-boualem.fr\/info\/taln\/definition-du-taln\/","title":{"rendered":"D\u00e9finition du TALN"},"content":{"rendered":"<h3><span style=\"color: #0000ff;\"><strong>Source Wikipedia<\/strong><\/span><\/h3>\n<p>Le <b>Traitement automatique du langage naturel<\/b> ou <b>de la langue naturelle<\/b> (abr. <i>TALN<\/i>) ou <b>des langues<\/b> (abr. <i>TAL<\/i>) est une discipline \u00e0 la fronti\u00e8re de la <a title=\"Linguistique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Linguistique\">linguistique<\/a>, de l&rsquo;<a title=\"Informatique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Informatique\">informatique<\/a> et de l&rsquo;<a title=\"Intelligence artificielle\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Intelligence_artificielle\">intelligence artificielle<\/a>, qui concerne l&rsquo;application de programmes et techniques informatiques \u00e0 tous les aspects du langage humain<sup id=\"cite_ref-1\" class=\"reference\"><a href=\"http:\/\/fr.wikipedia.org\/wiki\/Traitement_automatique_du_langage_naturel#cite_note-1\">1<\/a><\/sup>. Ainsi, le TAL ou TALN est parfois nomm\u00e9 <b>ing\u00e9nierie linguistique<\/b>.<\/p>\n<h2><strong>Histoire<\/strong><\/h2>\n<p>L&rsquo;histoire du TAL commence dans les ann\u00e9es 1950, bien que l&rsquo;on puisse trouver des travaux ant\u00e9rieurs. En 1950, <a title=\"Alan Turing\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Alan_Turing\">Alan Turing<\/a> \u00e9ditait un article c\u00e9l\u00e8bre sous le titre \u00ab\u00a0Computing Machinery and Intelligence\u00a0\u00bb<sup id=\"cite_ref-2\"><a href=\"http:\/\/fr.wikipedia.org\/wiki\/Traitement_automatique_du_langage_naturel#cite_note-2\">2<\/a><\/sup> qui propose ce qu&rsquo;on appelle \u00e0 pr\u00e9sent le <a title=\"Test de Turing\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Test_de_Turing\">test de Turing<\/a> comme crit\u00e8re d&rsquo;intelligence. Ce crit\u00e8re d\u00e9pend de la capacit\u00e9 d&rsquo;un programme informatique de personnifier un humain dans une conversation \u00e9crite en temps r\u00e9el, de fa\u00e7on suffisamment convaincante que l&rsquo;interlocuteur humain ne peut distinguer s\u00fbrement &#8211; sur la base du seul contenu de la conversation &#8211; s&rsquo;il interagit avec un programme ou avec un autre vrai humain. L&rsquo;exp\u00e9rience de Georgetown en 1954 comportait la traduction compl\u00e8tement automatique de plus de soixante phrases russes en anglais. Les auteurs pr\u00e9tendaient que dans un d\u00e9lai de trois ou cinq ans, la traduction automatique ne serait plus un probl\u00e8me<sup id=\"cite_ref-3\"><a href=\"http:\/\/fr.wikipedia.org\/wiki\/Traitement_automatique_du_langage_naturel#cite_note-3\">3<\/a><\/sup>.<\/p>\n<p>Pendant les ann\u00e9es 1960, <a title=\"SHRDLU\" href=\"http:\/\/fr.wikipedia.org\/wiki\/SHRDLU\">SHRDLU<\/a>, un syst\u00e8me de langage naturel appel\u00e9 \u00ab\u00a0blocks world\u00a0\u00bb dont la base \u00e9tait des vocabulaires relativement restreints, fonctionnait extr\u00eamement bien, invitant les chercheurs \u00e0 l&rsquo;optimisme. Cependant, le progr\u00e8s r\u00e9el \u00e9tait beaucoup plus lent, et apr\u00e8s le rapport <a title=\"ALPAC (page inexistante)\" href=\"http:\/\/fr.wikipedia.org\/w\/index.php?title=ALPAC&amp;action=edit&amp;redlink=1\">ALPAC<\/a>\u00a0<a title=\"en:ALPAC\" href=\"http:\/\/en.wikipedia.org\/wiki\/ALPAC\">(en)<\/a> de 1966, qui constatait qu&rsquo;en dix ans de recherches les buts n&rsquo;avaient pas \u00e9t\u00e9 atteints, l&rsquo;ambition s&rsquo;est consid\u00e9rablement r\u00e9duite.<\/p>\n<p><a title=\"ELIZA\" href=\"http:\/\/fr.wikipedia.org\/wiki\/ELIZA\">ELIZA<\/a> \u00e9tait une simulation \u00e0 la mani\u00e8re de la psychoth\u00e9rapie rog\u00e9rienne, \u00e9crite par <a title=\"Joseph Weizenbaum\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Joseph_Weizenbaum\">Joseph Weizenbaum<\/a> entre 1964 \u00e0 1966. N&#8217;employant presque aucune information sur la pens\u00e9e ou l&rsquo;\u00e9motion humaine, ELIZA parvenait parfois \u00e0 offrir un semblant stup\u00e9fiant d&rsquo;interaction humaine. Quand le \u00ab\u00a0patient\u00a0\u00bb d\u00e9passait la base de connaissances (par ailleurs tr\u00e8s petite), ELIZA pouvait fournir une r\u00e9ponse g\u00e9n\u00e9rique, par exemple, en r\u00e9ponse \u00e0 \u00ab\u00a0J&rsquo;ai mal \u00e0 la t\u00eate\u00bb dire \u00ab\u00a0Comment cela se manifeste-t-il\u00a0?\u00a0\u00bb.<\/p>\n<p>Pendant les ann\u00e9es 1970 beaucoup de programmeurs ont commenc\u00e9 \u00e0 \u00e9crire des \u00ab\u00a0ontologies conceptuelles\u00a0\u00bb, dont le but \u00e9tait de structurer l&rsquo;information en donn\u00e9es compr\u00e9hensibles par l&rsquo;ordinateur. C&rsquo;est le cas de MARGIE (Schank, 1975), SAM (Cullingford, 1978), PAM (Wilensky, 1978), TaleSpin (Meehan, 1976), SCRUPULE (Lehnert, 1977), Politics (Carbonell, 1979), Plot Units (Lehnert 1981).<\/p>\n<p>Pendant ce temps, beaucoup de <a title=\"Chatterbot\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Chatterbot\">chatterbots<\/a> \u00e0 la mani\u00e8re d&rsquo;ELIZA ont \u00e9t\u00e9 \u00e9crits comme <a title=\"PARADE (page inexistante)\" href=\"http:\/\/fr.wikipedia.org\/w\/index.php?title=PARADE&amp;action=edit&amp;redlink=1\">PARADE<\/a>, <a title=\"Racter (page inexistante)\" href=\"http:\/\/fr.wikipedia.org\/w\/index.php?title=Racter&amp;action=edit&amp;redlink=1\">Racter<\/a>, et <a title=\"Jabberwacky\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Jabberwacky\">Jabberwacky<\/a>. D\u00e8s les ann\u00e9es 1980, \u00e0 mesure que la puissance informatique augmentait et devenait moins ch\u00e8re, les mod\u00e8les statistiques pour la traduction automatique ont re\u00e7u de plus en plus d&rsquo;int\u00e9r\u00eat.<\/p>\n<h2>TAL statistique<\/h2>\n<p>Les utilisations statistiques du traitement du langage naturel reposent sur des m\u00e9thodes <a title=\"Stochastique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Stochastique\">stochastiques<\/a>, <a title=\"Probabiliste\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Probabiliste\">probabilistes<\/a> ou simplement <a title=\"Statistique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Statistique\">statistiques<\/a> pour r\u00e9soudre certaines difficult\u00e9s discut\u00e9es ci-dessus, particuli\u00e8rement celles qui surviennent du fait que les phrases tr\u00e8s longues sont fortement ambigu\u00ebs une fois trait\u00e9es avec des grammaires r\u00e9alistes, autorisant des milliers ou des millions d&rsquo;analyses possibles. Les m\u00e9thodes de d\u00e9sambigu\u00efsation comportent souvent l&rsquo;utilisation de corpus et d&rsquo;outils de formalisation comme les <a title=\"Mod\u00e8les de Markov (page inexistante)\" href=\"http:\/\/fr.wikipedia.org\/w\/index.php?title=Mod%C3%A8les_de_Markov&amp;action=edit&amp;redlink=1\">mod\u00e8les de Markov<\/a>. Le TAL statistique comporte toutes les approches quantitatives du traitement linguistique automatis\u00e9, y compris la mod\u00e9lisation, la <a title=\"Th\u00e9orie de l'information\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Th%C3%A9orie_de_l%27information\">th\u00e9orie de l&rsquo;information<\/a>, et l&rsquo;<a title=\"Alg\u00e8bre lin\u00e9aire\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Alg%C3%A8bre_lin%C3%A9aire\">alg\u00e8bre lin\u00e9aire<\/a><sup id=\"cite_ref-4\"><a href=\"http:\/\/fr.wikipedia.org\/wiki\/Traitement_automatique_du_langage_naturel#cite_note-4\">4<\/a><\/sup>. La technologie pour TAL statistique vient principalement de l&rsquo;<a title=\"Apprentissage automatique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Apprentissage_automatique\">apprentissage automatique<\/a> et le <a title=\"Data mining\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Data_mining\">data mining<\/a>, tous deux en tant qu&rsquo;ils impliquent l&rsquo;apprentissage \u00e0 partir des donn\u00e9es venant de l&rsquo;<a title=\"Intelligence artificielle\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Intelligence_artificielle\">intelligence artificielle<\/a>.<\/p>\n<h2>Les applications du TAL<\/h2>\n<p>Le champ du traitement automatique du langage couvre de tr\u00e8s nombreuses disciplines de recherche qui peuvent mettre en \u0153uvre des comp\u00e9tences aussi diverses que les math\u00e9matiques appliqu\u00e9es ou\u00a0 le traitement du signal.<\/p>\n<p>Parmi les applications les plus connues, on peut citer celles en relation avec la production o\u00f9 la modification de texte:<\/p>\n<ul>\n<li>la <a title=\"Traduction automatique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Traduction_automatique\">traduction automatique<\/a> (historiquement la premi\u00e8re application, d\u00e8s les ann\u00e9es 1950)\u00a0;<\/li>\n<li>la <a title=\"G\u00e9n\u00e9ration automatique de textes\" href=\"http:\/\/fr.wikipedia.org\/wiki\/G%C3%A9n%C3%A9ration_automatique_de_textes\">g\u00e9n\u00e9ration automatique de textes<\/a>\u00a0;<\/li>\n<li>la <a title=\"Correcteur orthographique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Correcteur_orthographique\">correction orthographique<\/a>\u00a0;<\/li>\n<li>le <a title=\"R\u00e9sum\u00e9 automatique de texte\" href=\"http:\/\/fr.wikipedia.org\/wiki\/R%C3%A9sum%C3%A9_automatique_de_texte\">r\u00e9sum\u00e9 automatique de texte<\/a>\u00a0;<\/li>\n<li>la <a title=\"Reconnaissance de l'\u00e9criture manuscrite\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Reconnaissance_de_l%27%C3%A9criture_manuscrite\">reconnaissance de l&rsquo;\u00e9criture manuscrite<\/a>\u00a0;<\/li>\n<li>les <a title=\"Agent conversationnel\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Agent_conversationnel\">agents conversationnels<\/a>;<\/li>\n<li>la <a title=\"R\u00e9solution d'anaphores (page inexistante)\" href=\"http:\/\/fr.wikipedia.org\/w\/index.php?title=R%C3%A9solution_d%27anaphores&amp;action=edit&amp;redlink=1\">r\u00e9solution d&rsquo;anaphores<\/a>;<\/li>\n<li>La <a title=\"Reformulation\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Reformulation\">reformulation<\/a> et le <a title=\"Paraphrase\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Paraphrase\">paraphrasage<\/a>.<\/li>\n<\/ul>\n<p>Les applications en relation avec le traitement du signal:<\/p>\n<ul>\n<li>la <a title=\"Reconnaissance automatique de la parole\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Reconnaissance_automatique_de_la_parole\">Reconnaissance automatique de la parole<\/a>\u00a0;<\/li>\n<li>la <a title=\"Synth\u00e8se vocale\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Synth%C3%A8se_vocale\">synth\u00e8se de la parole<\/a>\u00a0;<\/li>\n<li>la <a title=\"Reconnaissance vocale\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Reconnaissance_vocale\">reconnaissance vocale<\/a>\u00a0;<\/li>\n<li>le <a title=\"Traitement de la parole\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Traitement_de_la_parole\">Traitement de la parole<\/a>.<\/li>\n<\/ul>\n<p>Les applications en relation avec l&rsquo;extraction d&rsquo;information:<\/p>\n<ul>\n<li>la <a title=\"Recherche d'information\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Recherche_d%27information\">recherche d&rsquo;information<\/a> et la <a title=\"Fouille de textes\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Fouille_de_textes\">fouille de textes<\/a>\u00a0;<\/li>\n<li>la <a title=\"Reconnaissance d'entit\u00e9s nomm\u00e9es\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Reconnaissance_d%27entit%C3%A9s_nomm%C3%A9es\">reconnaissance d&rsquo;entit\u00e9s nomm\u00e9es<\/a>\u00a0; \u00e9tant donn\u00e9 un texte, d\u00e9terminer les noms propres, tels que des personnes ou des endroits;<\/li>\n<li>l&rsquo;<a title=\"Annotation s\u00e9mantique\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Annotation_s%C3%A9mantique\">annotation s\u00e9mantique<\/a>\u00a0;<\/li>\n<li>la <a title=\"Classification et cat\u00e9gorisation de documents\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Classification_et_cat%C3%A9gorisation_de_documents\">classification et la cat\u00e9gorisation de documents<\/a>\u00a0;<\/li>\n<li>la d\u00e9tection de <a title=\"Cor\u00e9f\u00e9rence\" href=\"http:\/\/fr.wikipedia.org\/wiki\/Cor%C3%A9f%C3%A9rence\">cor\u00e9f\u00e9rences<\/a>.<\/li>\n<\/ul>\n<h3><a title=\"Site .info de Malek Boualem\" href=\"http:\/\/www.malek-boualem.info\" target=\"_blank\">Malek Boualem<\/a><\/h3>\n","protected":false},"excerpt":{"rendered":"<p>Source Wikipedia Le Traitement automatique du langage naturel ou de la langue naturelle (abr. TALN) ou des langues (abr. TAL) est une discipline \u00e0 la fronti\u00e8re de la linguistique, de l&rsquo;informatique et de l&rsquo;intelligence artificielle, qui concerne l&rsquo;application de programmes et techniques informatiques \u00e0 tous les aspects du langage humain1. Ainsi, le TAL ou TALN [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"parent":68,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-122","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/pages\/122","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/comments?post=122"}],"version-history":[{"count":0,"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/pages\/122\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/pages\/68"}],"wp:attachment":[{"href":"https:\/\/www.malek-boualem.fr\/info\/wp-json\/wp\/v2\/media?parent=122"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}