Apprentissage/didactique des langues étrangères et TALN : analyse de corpus écrits à l'aide d'outils d'extraction automatique du langage - archive-EduTice - Education et technologies de l'information et de la communication Accéder directement au contenu
Communication Dans Un Congrès Année : 2006

Apprentissage/didactique des langues étrangères et TALN : analyse de corpus écrits à l'aide d'outils d'extraction automatique du langage

Résumé

New text analysis softwares issued from fields of research such as Machine Learning and Natural Languages Processing prove to be relevant tools for the language sciences. Littératron is a new data-processing tool for the automatic extraction of syntactic patterns, designed at LIP6 by Jean-Gabriel Ganascia. Associated with a linear text analyser, it reveals the stylistic peculiarities of a text.
We will see that Littératron carries out a linguistic diagnosis of learners if used in language sciences, especially in the field of acquisition of written French as a foreign language. The learner can be from a heterogeneous group (various language levels and various mother tongues) or from a homogeneous group (only one language level and one mother tongue, here, Arabic). The interest of this approach is related to three fields: first, language didactics, on a purely educational basis; next, computational linguistics; finally, computer-assisted learning.
De nouveaux logiciels d'analyse textuelle tirent partie des progrès récents effectués en apprentissage symbolique et dans le traitement automatique des langues naturelles. Conçu au LIP6 par Jean-Gabriel Ganascia, le Littératron est l'un d'entre eux ; il extrait automatiquement des motifs syntaxiques à partir de textes écrits en langage naturel. Plus exactement, le Littératron prend comme entré un arbre d'analyse syntaxique et donne en sortie un certain nombre de motifs syntaxiques récurrents. Associé à un analyseur de textes, qui engendre l'arbre d'analyse syntaxique à partir de textes écrits en langage naturel, il révèle les singularités stylistiques de ces textes.
Nous allons voir qu'utilisé en sciences du langage, dans le domaine de l'acquisition du français écrit, le Littératron permet d'effectuer un diagnostic linguistique de l'apprenant, que celui-ci provienne d'une classe de langue hétérogène (différentes langues maternelles) ou homogène (une seule langue maternelle, en l'occurrence ici l'arabe). L'intérêt de cette approche concerne trois domaines : d'une part la didactique des langues, à titre éducatif ; d'autre part, la linguistique computationnelle, et enfin l'enseignement assisté par ordinateur.
Fichier principal
Vignette du fichier
jadt06_audras_ganascia.pdf (516.93 Ko) Télécharger le fichier
Loading...

Dates et versions

edutice-00086924 , version 1 (20-07-2006)

Identifiants

  • HAL Id : edutice-00086924 , version 1

Citer

Isabelle Audras, Jean-Gabriel Ganascia. Apprentissage/didactique des langues étrangères et TALN : analyse de corpus écrits à l'aide d'outils d'extraction automatique du langage. 8èmes Journées internationales d'Analyse statistique de Données Textuelles 2006, Apr 2006, Besançon, France. pp.67-77. ⟨edutice-00086924⟩
289 Consultations
356 Téléchargements

Partager

Gmail Facebook X LinkedIn More