Perspectives de l'apport de l'EIAO dans l'apprentissage des langues:
modélisation de l'apprenant et diagnostic d'erreurs

Ref: (1992) Chanier T.: "Perspectives de l'apport de l'EIAO dans l'apprentissage des langues étrangères: modélisation de l'apprenant et diagnostic d'erreurs". ICO: Revue de liaison de la recherche en Informatique Cognitive des Organisations. Montréal. vol 3, n.4. pp 25-34.

Résumé: Que peuvent apporter Intelligence Artificielle et Informatique-Linguistique à l'apprentissage des langues étrangères ? C'est à cette question que tente de répondre cet article, par delà les rejets a priori de certains concepteurs d'environnements informatiques d'apprentissage et les promesses, parfois maladroites, de certains chercheurs en Intelligence Artificielle. La discussion est malaisée car l'informatique a, jusqu'à présent, été principalement utilisée pour adresser un registre limité de compétences chez l'apprenant avec des objectifs souvent confus. La plupart des systèmes faisant appel à l'Intelligence Artificielle et à l'Informatique-Linguistique ont choisi les mêmes axes d'intervention. Une grande partie de l'article présente ces systèmes d'EIAO en montrant leur originalité et limites lorsqu'ils visent à mieux représenter l'apprenant, ses connaissances et son acquisition, au travers d'un diagnostic de ses erreurs. Dans la dernière partie, l'auteur défend l'idée que l'informatique peut, non seulement, assister l'apprentissage des langues, mais également le modéliser afin d'essayer de mieux le comprendre. Cette voie fait également l'objet de recherches en Intelligence Artificielle.

Par: Thierry CHANIER, Université Clermont 2, Université Paris 5, France

1. EIAO et apprentissage des langues assisté par ordinateur: confrontation ou intégration ?

Les chercheurs et développeurs d'environnements informatiques pour l'apprentissage des langues désireux d'intégrer certaines des approches venant de l'Intelligence Artificielle (IA) et de l'Enseignement "Intelligemment" Assisté par Ordinateur (EIAO) ont souvent eu, par le passé, une position marginale dans le milieu de l'Acquisition des Langues Assistée par Ordinateur (ALAO). Pour en comprendre les raisons et saisir les évolutions possibles, il faut, à la lumière de ce que l'on croit être aujourd'hui les enjeux de l'utilisation de l'ordinateur pour l'acquisition des langues, revenir sur ce qu'ont été les débuts de l'EAO des langues.

L'individualisation de la formation est sans doute l'un des objectifs les plus souvent assignés à l'ordinateur. Mais à quels besoins de l'apprenant la formation doit-elle répondre et quels sont les différents registres de compétences de l'apprenant que l'on peut adresser ? Ces questions intéressent toute la communauté des formateurs de langues étrangères et des linguistes appliqués. Pour nombre d'entre eux, il apparaît aujourd'hui nécessaire d'élaborer sa stratégie d'intervention en fonction des besoins des apprenants. L'identification de ces besoins permet de déterminer les niveaux de compétences visés pour un apprenant [TARONE 89]:

a) Compétences grammaticales pour une langue seconde 1(habileté à produire et comprendre des énoncés d'une langue corrects sur les plans syntaxique, lexical et phonologique),

b) Compétences sociolinguistiques (habileté à utiliser le langage de façon appropriée dans un contexte socioculturel donné),

c) Compétences communicatives (habileté à transmettre efficacement une information à un auditeur, y compris l'habileté à utiliser des stratégies de communication pour résoudre les problèmes qui surgissent au cours du processus - manque de connaissances, oublis,...).

L'informatique peut contribuer à développer certaines de ces compétences, mais également de façon plus large, à évaluer les connaissances de l'apprenant ou à modéliser ses processus d'acquisition. La distinction de ces différentes tâches permet de classer les environnements ALAO en plusieurs types:

1) Outils linguistiques permettant d'accéder et de manipuler des données linguistiques et d'acquérir des compétences dans la langue cible par effets de bord (traitement de textes, traduction assistée par ordinateur, base de données,...). Ces outils ne sont pas spécifiquement dédiés à l'apprentissage.

2) Environnements d'apprentissage finalisés pour l'acquisition de compétences linguistiques sur les points mentionnés précédemment, en écriture, lecture, oral, conçus à partir d'approches pédagogiques multiples.

3) Environnements de test des connaissances de l'apprenant.

4) Environnements permettant d'effectuer des recherches fondamentales sur l'acquisition des langues au travers d'une interaction avec l'ordinateur.

A ses débuts, à la fin des années 1960, l'EAO des langues (et de beaucoup d'autres disciplines), concevait souvent l'ordinateur comme un outil destiné à accomplir des tâches répétitives, extraites d'activités d'enseignement très conventionnelles autour d'exercices de grammaire sans contexte. Les interactions apprenant-système étaient très limitées et visaient surtout à sanctionner les connaissances de l'apprenant. Les logiciels construits étaient donc surtout de type 3 (environnements de test), et étaient abusivement qualifiés de support d'apprentissage.

A la fin des années 1970, l'EIAO apporta des perspectives nouvelles en ALAO. Elle proposait une nouvelle architecture pour les systèmes informatiques d'apprentissage (souvent baptisés "tuteurs intelligents" [WENGER 87]) construite autour de modules modélisant les partenaires potentiels du processus d'apprentissage: l'apprenant, l'expert, le pédagogue, et par extension l'interface du système. S'appuyant sur les nouvelles technologies de l'information, les acquis théoriques de l'IA et de la linguistique-informatique, les chercheurs montrèrent qu'il était fondamental de doter le système de connaissances sur le domaine d'apprentissage de façon à lui permettre d'interagir avec l'apprenant. Les prototypes d'environnements développés se fixaient pour objectif de supporter l'apprentissage en posant les premières pierres d'une modélisation des processus d'acquisition de l'apprenant.

Si cela revenait donc à promouvoir des environnements de type 2 et 4, c'est, en fait, surtout le type 2 qui reçut le plus d'attention. L'accent mis sur le développement d'un savoir linguistique expert, basé sur l'utilisation de techniques bien connues de traitement du langage naturel, concentra les travaux sur l'acquisition de compétences grammaticales autour d'énoncés détachés d'une réelle situation communicative. Le degré d'individualisation offert par les logiciels resta très limité, bien que ce point fût l'un des principaux sujets de controverse entre EAO et EIAO. Les modèles d'apprenants gérés automatiquement par les systèmes étaient sommaires et prenaient peu en compte les processus cognitifs mis en jeu dans l'acquisition d'une langue2. S'appuyant sur une critique facile des logiciels d'EAO existants3, certains articles présentant des tuteurs intelligents laissaient entendre qu'il serait facile de doter les systèmes informatiques de larges aptitudes de compréhension du langage et de possibilités de conduite de dialogues très interactifs. Ces affirmations qui sous-estimaient largement les difficultés, en laissant croire prématurément à une intégration des tuteurs dans les cursus de formation, furent battues en brèche par des chercheurs qui présentaient des logiciels d'EAO mieux conçus qu'auparavant ([FARRIGTON 89] par exemple).

Une telle controverse subsiste encore aujourd'hui. D'un côté, quelques linguistes appliqués rejettent l'utilisation de l'intelligence artificielle dans l'ALAO en argumentant leur position à partir de considérations "philosophiques" relatives aux possibilités de simuler l'intelligence humaine, mais en passant sous silence les résultats scientifiques apportés par l'IA4. De l'autre côté, des illusions sont encore entretenues par certains auteurs qui dessinent des architectures de systèmes d'EIAO très ambitieuses, dont chaque module est spécifié à partir d'interprétations trop optimistes d'articles de recherches représentant l'état de l'art en linguistique-informatique ([FARGHALY 89] par exemple).

En prenant des distances avec ces polémiques quelque peu passionnelles, nous voudrions dans la suite de l'article présenter un état des lieux réel des travaux de l'EIAO, plus spécialement orientés vers l'aide à l'acquisition d'une langue seconde, domaine d'application qui a suscité le plus de réalisations. La section 2 donne un rapide aperçu général sur les travaux en IA relatifs à l'acquisition de compétences complexes à implémenter, compte-tenu de l'état de l'art de nos connaissances (oral, écrit, compétences de type b et c). La section 3 détaille le diagnostic des erreurs de l'apprenant relatives à ses compétences grammaticales dans les tuteurs intelligents en le situant par rapport aux travaux correspondants sur l'Analyse d'Erreurs en linguistique appliquée. Ce point souvent adressé, mais encore mal résolu, approche la question de la modélisation cognitive de l'apprenant, l'un des enjeux principaux de l'ALAO. La section 4, enfin, conclut sur les perspectives d'intégration de l'EIAO et de l'ALAO.

2. L'EIAO dans les approches communicatives

Presque tout le monde dans le milieu de l'enseignement des langues s'accorde aujourd'hui sur la place prépondérante de l'interaction par rapport à l'instruction formelle dans l'acquisition d'une langue seconde. L'ALAO tend donc naturellement vers la promotion de l'ordinateur comme support permettant de plonger l'apprenant dans une situation communicative afin qu'il puisse exercer ses compétences sociolinguistiques et communicatives. Le développement des compétences grammaticales de l'apprenant n'est pas ignoré pour autant5. On souhaiterait pouvoir utiliser l'ordinateur, non seulement dans des exercices de grammaire, mais également pour un travail de développement de l'oral ou de l'écrit.

Ces utilisations potentielles de l'ordinateur posent beaucoup de problèmes: elles concernent des aspects de l'acquisition des langues où l'expertise est peu explicitée, et mobilisent des ressources informatiques que l'on maîtrise encore mal aujourd'hui. Ce défi, l'EIAO a commencé à le relever. Des projets récents de développement d'environnements de type tuteurs intelligents, ou bien d'environnements utilisant des techniques d'IA et de traitement du langage naturel s'intéressent à ces questions.

En ce qui concerne l'écrit, le projet PARNASSUS [NEUWIRTH 89] explore le problème de la description explicite de connaissances relatives à son enseignement et son apprentissage. La situation didactique consiste à demander à l'apprenant de corriger certains paragraphes qui violent des principes de cohérence globale du texte proposé. Même si le jeu de textes prédéfinis sur lequel portent les questions est très limité en nombre et en complexité, il reste cependant suffisamment riche pour permettre d'y appliquer des règles générales d'ordonnancement d'un texte que le système sait mettre en oeuvre explicitement lors de l'interaction avec l'apprenant.

Il est souvent admis qu’il ne sera pas possible à moyen terme d’utiliser l'ordinateur comme support d'apprentissage oral d'une langue étrangère. En fait l'état des travaux en synthèse et reconnaissance de la parole est suffisamment avancé pour permettre à des équipes d'ALAO et de traitement automatique du langage d'élaborer des projets communs, tel SPELL [LEFEVRE 91]. Partant du constat simple des enseignants de langue que la prononciation des apprenants s'améliore considérablement dès lors qu'ils ont compris que l'ensemble des phonèmes mis en jeu dans une langue étrangère peut être très différent de celui utilisé dans leur langue maternelle, SPELL vise à développer les outils nécessaires pour doter le système informatique des connaissances minimum sur la prononciation. Plus précisément, il cherche à élaborer des méthodes d'analyse susceptibles de caractériser la parole de locuteurs ne parlant pas leur langue maternelle, à développer des métriques représentatives des différences entre la prononciation de l'utilisateur et la prononciation optimale, et finalement à donner à l'utilisateur un retour d'information exploitable par lui-même afin qu'il puisse améliorer sa prononciation.

Quant aux environnements interactifs, un petit nombre de chercheurs s'intéressant à leur développement ont choisi de doter le système d'un minimum de connaissances et métaconnaissances pour qu'il devienne un véritable partenaire dans le dialogue avec l'apprenant qui peut alors résoudre des tâches concrètes dans des micro-mondes: l'apprenant peut, par exemple, aider un personnage à se laver dans une salle de bains [HAMBURGER 91], ou à participer à un jeu d'aventures [MULFORD 89]. Dans ces situations, l'enjeu pédagogique porte sur l'acquisition, plus particulièrement l'utilisation, de compétences grammaticales et lexicales minimum, couplées à des compétences communicatives pour maintenir un dialogue finalisé avec le système. Quant aux compétences sociolinguistiques, quelques projets s'y intéressent également. Le système PILEFACE [LELOUCHE 91], s'appuyant sur les travaux en linguistique-informatique sur les actes de parole, offre à l'apprenant une situation de dialogue dans laquelle les relations socioculturelles entre interlocuteurs sont explicitement fixées. Le système lui propose de jouer le rôle d'un des interlocuteurs du dialogue afin d'en saluer un autre, en tenant compte des conventions de langage de la langue cible, le français.

Tous les projets mentionnés précédemment sont bien sûr prospectifs. Aucun n'a encore donné lieu à la réalisation de logiciels commercialisables. Leurs objectifs prioritaires sont l'étude du contenu des différents modules (expert, pédagogue, apprenant) du système d'apprentissage dans le cadre d'une approche communicative, le test des techniques de traitement du langage naturel et d'IA afférentes au domaine, voire, dans certains cas, le développement de nouvelles techniques . Les résultats de ces projets peuvent servir de base de discussions pour toute l'ALAO, qui en est à ses premiers pas dans la réalisation de logiciels basés sur une approche communicative.

Mais il est au moins un point sur lequel la discussion ne peut qu'être très réduite: c'est celui du modèle de l'apprenant. Compte-tenu des multiples problèmes à aborder, les chercheurs que nous avons cités dans cette section semblent pour l'instant avoir fortement restreint sa place et son contenu. Si tout le monde s'accorde en EIAO sur son rôle fondamental, il faut se tourner vers l'apprentissage formel en machine, et non plus fonctionnel, pour l'illustrer. C'est le sujet de la section suivante.

3. Modélisation de l'apprenant et diagnostic d'erreurs

La plupart des systèmes informatiques d'aide à l'apprentissage d'une langue seconde ont un diagnostic très approximatif des interactions entre l'apprenant et le système, et donc une aptitude très peu individualisée au suivi de l'apprentissage, que le système adopte une approche didactique ou bien collaborative. Cette limitation est d'autant plus criante que les résultats des travaux de recherche en psycho-linguistique et en linguistique appliquée ont mis l'accent sur l'importance de la connaissance des structures propres des règles de l'apprenant et de ses processus cognitifs d'élaboration d'un nouveau savoir sur la langue cible ainsi que sur l'utilisation de ce savoir en situation de communication.

Les systèmes d'EIAO ont, pour leur part, toujours placé l'élaboration d'un modèle de l'apprenant au centre de leurs préoccupations [SELF 88]. La plupart des tuteurs intelligents en langue seconde développés à ce jour ont visé l'apprentissage de compétences grammaticales. Dans cette section, nous nous proposons de montrer de quelles façons ils ont abordé le problème de la modélisation de l'apprenant en cherchant à diagnostiquer ses erreurs (ou phrases divergentes).

D'abord, un rappel des travaux sur ce qu'on appelle "l'Analyse d'Erreurs" en linguistique appliquée, nous aidera à situer les enjeux du diagnostic. Suivra ensuite une revue critique des travaux en EIAO à ce sujet. Pour la clarté de notre exposé, nous classerons la plupart des systèmes existants en deux types: les systèmes à calcul automatique d'erreurs et les systèmes à analyse d'erreurs à champs restreints . Les premiers mettent l'accent sur l'utilisation de techniques d'informatique-linguistique et les seconds sur une description relativement exhaustive des occurrences d'erreurs dans leurs domaines spécifiques d'apprentissage. Nous introduirons ensuite un troisième type de systèmes récents visant à couvrir une recherche de base sur le recueil d'expertises et sur la modélisation des processus de l'apprenant. Leur but est de combler les lacunes des deux premiers types de systèmes en s'approchant d'un diagnostic d'erreurs plus conceptuel. Notre approche du problème sera présentée en fin de section.

3.1. Analyse d'Erreurs en linguistique appliquée

L'accent mis sur la nécessité de disposer d'explications de nature plus profonde sur les performances de l'apprenant est venu des travaux autour de l'Analyse d'Erreurs en linguistique appliquée, commencés au début des années 1970 [RICHARDS 74]. Les apprenants d'une langue seconde ont alors été perçus comme construisant activement leurs règles à partir des données auxquelles ils étaient confrontés, les adaptant progressivement en direction de la langue cible (aussi appelée L2). Cela signifiait que les erreurs de l'apprenant n'avaient plus besoin d'être vues comme des signes d'échec, comme c'était le cas auparavant. Ces erreurs étaient les preuves que l'apprenant développait son propre système de règles. Emergeant de ces études, plusieurs processus cognitifs ont alors été proposés comme sources possibles d'explications des erreurs. Les quatre séries d'explications le plus souvent reconnues [ELLIS 85] sont :

- l'interférence avec la langue maternelle: l'apprenant utilise son expérience précédente acquise dans sa langue maternelle (aussi appelée L1) comme un moyen pour structurer ses connaissances sur L2.

- l'interférence avec le milieu institutionnel: l'apprenant, en milieu institutionnel, est toujours sous l'influence de l'enseignant et des auteurs de livres pédagogiques qui, inévitablement, mettent l'accent sur certains aspects de la langue cible pour en négliger d'autres, d'après leurs propres croyances et expériences. Cette présentation peut avoir l'indésirable effet d'amener l'apprenant à utiliser cette connaissance à mauvais escient.

- les stratégies d'apprentissage de l'apprenant: certaines des stratégies mises en oeuvre par l'apprenant afin d'alléger la tâche d'apprentissage de L2 peuvent avoir l'effet de bord d'être génératrices d'erreurs, par sur-généralisation des règles de la langue cible. Dans ce cas, l'apprenant a acquis une part de savoir linguistique avec des stratégies qu'il trouve utiles pour l'organisation de ses données sur L2, mais qu'il applique trop largement. Ce phénomène est très fréquemment rencontré.

- les stratégies de communication de l'apprenant: l'apprenant a recours a certaines stratégies de communication lorsqu'un savoir lui manque, ou encore qu'il ne peut accéder aux ressources linguistiques nécessaires à la formulation d'un contenu sémantique déterminé et qu'il se trouve dans une situation le contraignant à communiquer. Il peut utiliser des stratégies de réduction en essayant d'esquiver le problème (omission de mots non essentiels au maintien de la communication); ou des stratégies d'accomplissement lui permettant de compenser ses moyens limités par l'utilisation d'expressions originales ad hoc.

EL: Result Window
Your original sentence was:
>>> the man big was swims to a boats <<<
EL' version of your sentence is:
>>> the big man was [swimming] to the boats <<<
EL: Advice Window
- The word was moved from position <3> to <2>
- The word has been changed to due to the plurality of
- Tutor: The pronoun and aux verb must agree
- The word at position <5> has been inflected with the affix(es) <[ing]> to produce the corrected word

Figure 1 Exemple de diagnostic offert par le système EL

Bien que cette analyse en profondeur du comportement de l'apprenant soit particulièrement appropriée à la mise en place de procédures individualisées de remédiations à ces erreurs par l'enseignant, puisqu'elle permet d'identifier les problèmes rencontrés lors du processus d'acquisition lui-même, son désavantage est d'être très consommatrice en temps et seulement adaptée à un rapport unique formateur-apprenant, qui n'est pas privilégié par le milieu institutionnel. Ce type d'analyse est donc un bon candidat à la formation assistée par ordinateur.

3.2. Systèmes à calcul automatique d'erreurs

Un système à calcul automatique d'erreurs est principalement composé d'une grammaire computationnelle6 et d'un analyseur automatique7 d'erreurs. Cet analyseur utilise, outre les stratégies habituelles d'analyse des phrases correctes du langage concerné, des stratégies spécifiques destinées à reconnaître des énoncés erronés, à localiser les erreurs (ou divergences) par rapport à la grammaire computationnelle de référence, et , dans le meilleur des cas, à donner des indications de corrections (cf figure 1). La stratégie pédagogique sous-jacente à ces systèmes consiste à montrer à l'apprenant ses erreurs, et quelquefois à entamer un dialogue avec l'utilisateur de façon à lui permettre de se corriger.

La localisation d'une erreur dans une grammaire computationnelle est un problème ardu. Un des enjeux est la découverte d'algorithmes de calcul des contraintes effectivement violées dans les règles de grammaire standard par les énoncés divergents, de manière à limiter la prolifération de règles préprogrammées traitant de façon ad hoc des divergences ponctuelles (ces règles préprogrammées sont souvent appelées mal-rules dans les tuteurs). L'étude de systèmes à analyse automatique d'erreurs, tels que FGA [BARCHAN 86], XTRA-TE [CHEN LI 89], EL [YAZDANI 89], le système de Menzel [MENZEL 88], ITLS [SCHWIND 91], montre les progrès qui ont été réalisés sur ce point. Aujourd'hui encore les réponses apportées sont loin d'être pleinement satisfaisantes.

Par ailleurs, nous pensons que, même si la maîtrise de telles techniques paraît souhaitable dans un tuteur de langues, elle n'en constitue pas l'enjeu final. La grammaire computationnelle n'est pas la grammaire que l'apprenant utilise (ni celle que le formateur enseigne). Le diagnostic d'une erreur et les explications correspondantes fournies ne font donc que refléter le comportement du système ou de l'analyseur, mais reflètent mal l'utilisation que l'apprenant fait de ses propres règles. Puisque l'analyse automatique d'une phrase incorrecte peut faire échouer le programme correspondant, les erreurs de l'apprenant sont considérées comme un signe d'échec dans le processus d'apprentissage, témoins d'un trou dans son savoir par rapport au savoir "expert" du système. Ainsi l'apprenant n'est jamais perçu comme un agent qui se construit un nouveau savoir, et l'acquisition d'une langue seconde n'est pas comprise comme un processus élaboratif.

3.3. Systèmes à analyse d'erreurs à champs restreints

Parallèlement aux travaux référencés précédemment, d'autres visaient à accomplir une analyse d'erreurs plus complète. Dans certains domaines restreints de l'apprentissage d'une langue seconde, un inventaire exhaustif des erreurs a été entrepris. Les erreurs ont été couplées à des explications reposant sur des critères de linguistique appliquée correspondant de façon plus adéquate aux propres processus d'acquisition des apprenants. ALICE [CERRI 89] et VP2 [SCHUSTER 86] en sont deux exemples représentatifs.


Tutor: Translate the following sentence:
yo soñé con los 'angeles.

Student: I dreamed of the angels.

Tutor: Correct! Note that the direct
translationof <soñar con>-<dream with>
does not exist in English. In English you
can also use <dream about> in this sentence.

Figure 2 : Dialogue étudiant espagnol-tuteur à propos de l'utilisation d'une construction verbale anglaise dans le système VP2

VP2 (cf figure 2) est un tuteur dédié à l'enseignement des constructions verbales (verbe + préposition) de l'anglais par des espagnols. Focalisant sur les problèmes d'interférences entre les deux langues il utilise, non pas une grammaire computationnelle, comme dans les exemples précédents, mais deux. La grammaire de l'espagnol sert de modèle de l'apprenant et rend compte des erreurs éventuelles des apprenants dans ce domaine d'apprentissage où de grandes variations existent entre les deux langues.

Si les analyses d'erreurs sont de meilleures qualité et plus exhaustives dans de tels systèmes (par rapport à ceux évoqués en section 3.2.) la question se pose de la généralité des choix faits par leurs auteurs. Ne s'appuyant pas sur un cadre plus général de modélisation de l'acquisition d'une langue seconde, leur extension à des corpus de problèmes linguistiques plus larges, et à des cas plus variés d'erreurs (par exemple, dans le cas de VP2, d'erreurs ne pouvant s'expliquer par des phénomènes d'interférence) peut paraître problématique.

3.4. Saisir et modéliser les processus de l'apprenant

Durant les deux ou trois dernières années, des projets ont ouvert quelques voies de recherche afin d'apporter une meilleure compréhension et formalisation des processus d'acquisition de l'apprenant en vue d'élargir et/ou d'approfondir le champ du diagnostic de ses erreurs.

Premièrement, des prototypes adressent la question du support automatique du recueil d'expertises fondamentales destinées à alimenter le modèle de l'apprenant, expertises provenant des différents partenaires du processus d'apprentissage. Le système NOBILE [CERRI 91] autorise les experts, c'est-à-dire les enseignants, à spécifier différents modèles d'apprenants au travers d'interactions multiples. Ainsi dans un "dialogue inversé", l'ordinateur joue le rôle de l'apprenant et génère des énoncés divergents, et l'utilisateur/enseignant, lui, joue celui de l'expert. Notre prototype IFAAR [PENGELLY 91], sous-module du projet BELLOC décrit dans la prochaine section, offre une interface pour l'acquisition d'expertises sur des énoncés divergents réels d'apprenants. A la lumière des expériences entreprises dans le cadre du projet, il apparaît que les experts concernés n'étaient pas accoutumés à mener à bien des diagnostics individualisés en profondeur, et que les techniques utilisées couramment en acquisition de connaissances pour les systèmes experts sont peu applicables. Un besoin pressant se fait sentir de disposer de techniques de recueil d'expertises efficaces pour ce domaine.

Deuxièmement, d'autres projets visent à l'acquisition d'une capacité de diagnostic plus profond des processus de l'apprenant. Outre le projet BELLOC, le système ET [FUM 91] en est une bonne illustration. Ce tuteur propose à des apprenants italiens une série d'exercices simples sur les accords de temps en anglais. Il utilise (cf figure 3) un catalogue de mal-rules représentant les erreurs stéréotypiques des apprenants sur le domaine et des techniques de génération automatique de mal-rules, basées sur des algorithmes d'apprentissage-machine (machine learning). Une réponse erronée de l'apprenant déclenche dans le système un processus de recomposition de l'erreur, identifiant les contraintes violées, un calcul de la réponse standard attendue et l'émission d'un certain nombre de règles-hypothèses sur le comportement de l'apprenant. Ces hypothèses sont prises en compte dans le choix des exercices ultérieurs. Une déduction basée sur des techniques IA de raisonnements non-monotones permet au système de confirmer ou invalider ces hypothèses en fonction des réponses futures de l'apprenant. La lenteur des réponses du système et l'étroitesse du domaine abordé rendent toute utilisation en situation réelle d'un tel logiciel, pour l'instant, prématurée. Mais il a le mérite de montrer que l'on commence à savoir gérer des raisonnements complexes et une analyse fine de certains aspects de l'apprentissage assisté par ordinateur.

Figure 3 : L'architecture du modélisateur du système ET met en évidence le large éventail des connaissances mobilisées.

Enfin, une autre perspective est l'approche exploratoire adoptée dans le système SWIM [ZOCK 91] qui autorise l'apprenant à construire explicitement ses hypothèses sur l'interlangue, à les tester, et conséquemment à mettre à jour ses propres règles. Même si aucune modélisation explicite de l'apprenant n'est visée, le système donne un aperçu de la façon dont sont apprises les structures de la langue cible. Il est intéressant de noter qu'ici les erreurs ne sont pas seulement considérées comme une partie inévitable du processus d'apprentissage, mais aussi comme une source fondamentale d'informations.

3.5. Le projet BELLOC

Dans le projet BELLOC8 [CHANIER 90], nous avons d'abord imaginé ce que pourrait être, en l'état actuel des connaissances dans les domaines afférents à l'ALAO, un diagnostic conceptuel des phrases divergentes d'un apprenant conduit automatiquement par un système informatique (cf figure 4). Désirant travailler dans un environnement communicatif, autour d'une situation "résolution de problèmes", nous sommes partis de l'hypothèse qu'il était indispensable, pour la conduite du dialogue apprenant-système, d'utiliser les techniques et formalismes correspondants de linguistique-informatique, mais que ceux-ci,pour les raisons mentionnées précédemment, ne pouvaient correctement modéliser l'apprenant. Nous désirions proposer une structure de règles permettant, pour un apprenant donné, d'encapsuler l'état courant de ses connaissances grammaticales sur le corpus concerné par le dialogue, ainsi que les stratégies utilisées pour construire et utiliser ses connaissances.

Autour de la situation-problème imaginée, nous avons recueilli un corpus de phrases en français d'apprenants anglais posant problème et demandé à des experts (formateurs d'enseignants de langue et apprentis enseignants) leur diagnostic. Nous avons, pour cela, conçu un environnement informatique de recueils d'expertises, IFAAR, les invitant à décomposer leur diagnostic en autant de vues qu'ils le désiraient et leur laissant le choix de l'étiquetage de chacune de ces vues. Les seules connaissances à priori que nous leur offrions étaient celles relatives à la grammaire computationnelle couvrant le sous-domaine du français en jeu. L'accès à ces connaissances n'était pas, bien sûr, un point de passage obligé. A partir de l'analyse de ce recueil d'expertises, nous avons alors proposé une structure de règle (cf figure 5 ), baptisée "règle applicable". Une règle applicable a pour but de représenter aussi bien les règles de l'apprenant que celles de l'enseignant. Ce degré d'équivalence entre apprenant et enseignant vise à ne plus mettre l'accent sur la perception d'une erreur comme un échec mais à dresser des liens plus étroits entre, d'une part, les processus de production et de mise au point des règles de l'apprenant et, d'autre part, les processus de simplification du savoir de l'enseignant à des fins pédagogiques. A travers des exemples, nous avons illustré [CHANIER 91] comment un tuteur pourrait conduire un diagnostic plus conceptuel du comportement de l'apprenant. Enfin, dans une expérience limitée, nous avons utilisé cette structure de règle applicable pour simuler, par ordinateurs interposés, la conduite d'un tel diagnostic avec des apprenants.


("A" correspond à "Apprenant" et "S" à "Système")
A: Jean a-t-il une soeur?
S: Oui.
A: Est-elle vivante ?)
S: Oui.
A: Que est sa adresse ? (What is her address ?)
S: There is a problem in your last sentence.
Would you accept this utterance (yes/no) ? :
(Cecile lives with her brother) Cécile vit avec son frère.
A: yes
S: OK. Would you accept this utterance (yes/no) ?:
ta autre soeur
A: yes
S: I think the problem is the following:
You cannot say: ta autre soeur
But you can say: ta soeur, ton autre soeur
Explanation (yes/no) ?
A: yes
S: You can also say: ma belle héritière, mon héritière
Because : the masculine forms "mon", "ton", "son" are found qualifying a feminine singular noun, when they are followed by a word beginning with a vowel or h-mute.
Do you want a complete presentation of the rule <Possessive Adjective Agreement> (yes/no) ?

Figure 4 : Dialogue permettant de discriminer deux explications possibles du comportement de l´apprenant à propos d´un problème morphologique d´accord entre "sa" et "adresse".

L'information contenue dans les règles applicables esquisse les stratégies utilisées par l'apprenant et fournit ainsi une source de connaissances fondamentales pour le modèle de l'apprenant. De plus, dans les règles applicables le niveau implémentation (mise en oeuvre informatique) est clairement séparé du niveau conceptuel. Par delà les façons très différentes dont ces règles pourraient être implémentées, et les stratégies propres qu'elles pourraient utiliser pour reconnaître une phrase divergente de l'apprenant, elles ont toutes la même structure. Nous avons distingué trois types de règles applicables. Premièrement, les règles "prédéfinies" reconnaissent les phrases divergentes qui ont trait à des difficultés linguistiques spécifiques que, seul un enseignant expert, peut prédire. Au niveau informatique une telle règle prédéfinie pourrait être comparée à une mal-rule9. Deuxièmement, les règles de "grammaire pédagogique" correspondent aux règles de l'enseignant. Constituant une partie de l'objectif pédagogique, elles devraient être exprimées dans un formalisme dont le métalangage serait proche de celui pratiqué en milieu institutionnel. Troisièmement, les méta-règles décrivent les stratégies générales de l'apprenant. Elles permettraient la génération automatique de règle applicables spécifiques de l'apprenant courant.

Compte-tenu des limites en moyens et durée du projet BELLOC, les expériences menées ne répondent pas aux critères scientifiques rigoureux utilisés, par exemple, en psychologie expérimentale. Notre modèle ne peut donc prétendre, en l'état actuel, à une réelle validité cognitive (autant que faire se peut sur ce plan); pas plus qu'à une quelconque démonstration informatique de capacités de diagnostic conceptuel, puisque l'essentiel du travail n'a donné lieu qu'à des spécifications. Mais ces spécifications essayent d'intégrer des travaux en linguistique appliquée, en informatique-linguistique avec un recueil d'expertises du domaine, en tenant compte des possibilités et limites informatiques actuelles. Par delà les prospectives d'implémentation de sous-modules du système BELLOC, notre modèle est une base de discussion originale10 pour la modélisation cognitive des compétences grammaticales de l'apprenant, champ dans lequel l'articulation entre les différentes approches mentionnées est justement si problématique.

4. ALAO et EIAO des langues: une dynamique convergente

Le survol des travaux en EIAO des langues, et particulièrement de ceux portant sur l'acquisition de compétences grammaticales dans l'apprentissage d'une langue seconde, a montré l'évolution des perspectives de travail des chercheurs concernés. Partant d'une démarche un peu isolationniste visant (grossièrement) à intégrer quelques techniques d'IA dans des systèmes d'apprentissage reposant sur une analyse sommaire des enjeux pédagogiques et des processus cognitifs mobilisés par l'apprenant, les chercheurs se sont orientés vers l'intégration d'expertises complexes avec une attention particulière aux aspects conceptuels de l'acquisition et la mise en oeuvre de techniques d'IA plus sophistiquées, voire même le développement de nouvelles techniques spécifiques.

Figure 5 : Structure d'une règle applicable

La dialectique de la controverse, évoquée en introduction, entre partisans et détracteurs de l'IA en ALAO a conduit nombre de chercheurs du domaine à rejeter le cloisonnement entre disciplines et à élaborer des axes de recherches et développements s'appuyant sur une approche pluridisciplinaire: linguistique appliquée, psychologie cognitive, informatique-IA. Cette dynamique rejoint celle de la recherche en acquisition des langues [ELLIS 90]: identification précise des contextes d'apprentissage en milieu institutionnel et non institutionnel, permettant de sélectionner des situations limitées d'apprentissage donc modélisables sur ordinateur; recentrage sur la communication et l'interaction dans des activités langagières offrant à l'ordinateur, doté des nouvelles technologies multi-média, le rôle d'un partenaire privilégié dans les échanges; recentrage sur l'apprenant, donc sur une individualisation de la formation, qui est la situation de base des rapports système informatique-apprenant.

De plus l'expérience accumulée dans l'utilisation de l'informatique a conduit le milieu ALAO a mieux cerner la spécificité de la situation d'apprentissage homme-machine, par rapport à celles des rapports formateurs-apprenants en milieu institutionnel. L'ordinateur est, aujourd'hui, considéré comme un partenaire à part entière du processus d'acquisition. Il est généralement reconnu nécessaire de rechercher de nouveaux modèles pour son utilisation dans l'apprentissage des langues, modèles qui ne dériveraient pas d'autres modes d'enseignement et qui se démarqueraient des tendances antérieures à comparer ou opposer ordinateurs et formateurs humains11. Les théories de l'acquisition dans le cadre d'approches communicatives doivent être modifiées pour incorporer le mode spécial de communication apprenant-système ALAO. Une partie des chercheurs défendent la constitution d'un axe de travail centré autour de "la Recherche Assistée par Ordinateur sur l'Acquisition des Langues"[GARRETT 91]. Il s'agirait là d'une recherche fondamentale sur les processus cognitifs caractéristiques du domaine, sans liens directs avec des applications pédagogiques.

Cette façon de poser les problèmes rejoint, comme nous l'avons vu, les hypothèses de travail développées autour des tuteurs intelligents. La perspective d'un travail à composantes disciplinaires multiples offre à l'EIAO une opportunité d'intégration complète en ALAO, essentiellement autour d'environnements de type 2 et 4. La valorisation de la recherche sur la modélisation de l'acquisition (type 4) permet d'élaborer des prototypes qui ne seront pas évalués avec les mêmes critères que ceux destinés directement à la formation. Quant aux environnements destinés directement à l'apprentissage (type 2), la banalisation de l'intégration des techniques et théories de l'IA conduira tout naturellement à considérer le qualificatif "intelligents", appliqué à ces systèmes, comme obsolète parce qu'appartenant à un passé révolu de divisions arbitraires.

Bibliographie

Barchan J., Woodmansee B.J.& Yazdani M.(1986): "A PROLOG-based Tool for French Grammar Analysis". Instructional Science, vol. 14, pp. 21-48.

Catt M.& Hirst G.: "An intelligent CALI system for grammatical error diagnosis", Computer Assisted Language Learning., vol 3. pp 3-26.

Cerri S.A. (1989): "ALICE: Acquisition of Linguistic Items in the Context of Examples". Instructional Science , vol. 18, pp. 63-92.

Cerri S., Cheli E.& McIntyre A.(1991): "Nobile: Object-Based User Model Acquisition for Second Language Learning", in Bridge to International Communication: Intelligent Tutoring Systems for Second-Language Learning, Swartz M.& Yazdani M (eds). New York: Springer-Verlag..

Chanier T., Dillenbourg P., Hartley R., Hinzte D., Nichols D., Pengelly M., Self J.& Twidale M. (1990): A Prototype for the Acquisition of Rule-Based Student Models. AI-Report n° 40, Computing Department, University of Lancaster, janvier.

Chanier T., Pengelly M., Twidale M.& Self J.(1991):"Conceptual Modelling in Error Analysis in Computer-Assisted Language Learning Systems", in Bridge to International Communication: Intelligent Tutoring Systems for Second-Language Learning, Swartz M.& Yazdani M (eds). New York: Springer-Verlag.

Chen Li & Barry L.K. (1989): "XTRA-TE: Using Natural Language Processing Software to Develop an ITS for Language Learning". 4th International Conference on Artificial Intelligence and Education; Amsterdam, mai, pp. 54-63.

Ellis R. (1985): Understanding Second Language Acquisition.. Oxford: Oxford University Press.

Ellis R. (1990): Instructed Second Language Acquisition. Oxford: Blackwell.

Farghaly A.(1989): "A Model for Intelligent Computer Assisted Language Instruction", Computers and the Humanities, vol 23,1, janvier.

Farrington B. (1989): "Une expérience d'EAO de français langue étrangère au niveau universitaire", Langue Française, n° 83, septembre.

Fum D., Giangrandi P.& Tasso C.(1991): "The use of explanation-based learning for modelling student behavior in foreign language tutoring", in Bridge to International Communication: Intelligent Tutoring Systems for Second-Language Learning, Swartz M.& Yazdani M (eds). New York: Springer-Verlag.

Garrett N. (1991): "CARLA comes to CALL", Computer Assisted Language Learning. vol 4,1. pp 41-45.

Hamburger H. & Hashim R.(1991): "Foreign Language Tutoring and Learning Environment", in Bridge to International Communication: Intelligent Tutoring Systems for Second-Language Learning, Swartz M.& Yazdani M (eds). New York: Springer-Verlag.

Last R.W. (1989): Artificial Intelligence Techniques in Language Learning. Ellis Horwood.

Lefèvre J.P.(1991): " L'apprentissage de la prononciation en langue étrangère: le projet SPELL", Conférence Génie Linguistique 91, Versailles, janvier.

Lelouche R. (1991): "Using multiple knowledge bases to help teach some pragmatic aspects of French", Computer Assisted Language Learning. vol 4,1. pp 29-40.

Menzel W. (1988): "Error Diagnosis and Selection in a Training System for Second Language Learning". COLING 88, Budapest, août.

Mulford G.W. (1989): "Semantic Processing for Communicative Exercises in Foreign-Language Learning". Computers and the Humanities, Special Issues on the Intelligent Computer-Assisted Language Instruction. Vol. 23, 1, janvier.

Neuwirth C.(1989): "Intelligent Tutoring Systems: Exploring Issues in Learning and Teaching Writing", Computer and the Humanities. vol 23. pp 45-57.

Pengelly M.& Chanier T.(1991):"Knowledge Acquisition for Learner Modelling in Second Language Learning", in Cognitive Modelling & Interactive Environment, Bouwhuis (eds). Springer-Verlag: à paraître.

Richards J.C. (1974): Error Analysis: Perspectives on Second Language Acquisition. Longman. Réimpression en 1984.

Schuster E. (1986): "The role of native grammars in correcting errors in second language learning". Computational Intelligence, vol. 2, pp. 93-98.

Schwind C.(1990): Critique du livre "Artificial Intelligence Techniques in Language Learning", Computational Linguistics, vol 16,4, décembre. pp 242-244.

Schwind, C. (1991): "An Intelligent Language Tutoring System". A paraître dans International Journal of Man-Machine Studies.

Self J.(1988): "Student models: What use are they ?", in Artificial Intelligence Tools in Education, Ercoli P. & Lewis R. (eds). Elsevier Science Publishers, North-Holland.

Tarone E.& Yule G.(1989): Focus on the Language Learner. Oxford University Press.

Wenger E. (1987): Artificial Intelligence and Tutoring Systems. Morgan Kaufmann.

Yazdani M., O'Brien P.& Byron G.(1989): An English Tutor: Project Report (1987-89). Report of the Department of Computer Science, University of Exeter, UK.

Zock M. (1991): "SWIM or Sink: The problem of communicating thought", in Bridge to International Communication: Intelligent Tutoring Systems for Second-Language Learning, Swartz M.& Yazdani M (eds). New York: Springer-Verlag.

Thierry CHANIER
Département de linguistique, Université Clermont 2,
34 av Carnot, 63037 Clermont-Ferrand Cedex, France.
ou UFR de Mathématiques et Informatique,
Université Paris 5, La Sorbonne,
12 rue Cujas, 75005 Paris.
Email: chanier@frocf51.bitnet


Notes

1 On utilisera de façon équivalente "langue seconde" et "langue étrangère". Les compétences grammaticales citées ici ne concernent que l´apprentissage d´une langue seconde, puisque ne figure aucune mention des aspects sémantiques qui touchent plutôt l´apprentissage de la langue maternelle.

2 Les environnements de type 4, modélisant l´acquisition dans ses aspects cognitifs n´intéressera vraiment l´EIAO des langues que plus tard, comme nous le verrons dans la suite de l´article.

3 Ces logiciels ont été abondamment critiqués (et le sont encore) par l´EIAO, mais aussi par la linguistique appliquée. La critique est "facile" car ils ont souvent été développés par des enseignants de langue qui se sont investis, en plus de leur travail habituel, dans l´apprentissage de l´informatique. Ils n´ont, en général, eu ni le concours des informaticiens, ni de celui des linguistes qui se détournaient alors des problèmes de formation assistée par ordinateur considérés comme peu valorisant au titre de la recherche.

4 cf le livre de Last [LAST 89], souvent malheureusement cité en référence en ALAO, et les réponses de Schwind [SCHWIND 90].

5 Elles sont toujours considérées comme importantes. Pour une discussion, qui évite l´écueil du parti-pris, on peut se reporter, par exemple, à [ELLIS 90], chapitre 6.

6 Une grammaire computationnelle est une grammaire construite à partir de techniques et formalismes utilisés en linguistique-informatique.

7 dans cette partie 3.2. le terme "analyseur" correspond au terme anglais "parser".

8 BELLOC était un sous-projet du projet européen DELTA NAT*LAB.

9 Elles peuvent s´implémenter comme des règles de grammaire computationnelle reproduisant le comportement ad hoc de l´apprenant.

10 signalons également un autre travail [CATT 90] avec une approche un peu similaire à la nôtre, dans ses préoccupations de départ.

11 On est aujourd´hui beaucoup plus réservé sur l´existence de "bons" critères d´évaluation des environnements ALAO. On a longtemps cherché à les opposer aux formateurs humains, alors qu´on ne disposait d´aucune expertise sérieuse sur la formation en milieu institutionnel. Cela aboutissait surtout à mesurer le degré de mauvaise intégration des logiciels dans les cursus de formation et la mauvaise qualité des matériels utilisés.