EIAO, quelques rep?res Monique Baron
L'objectif de cet article est de donner à des non-spécialistes quelques points de repère sur le domaine désigné par le sigle EIAO, sur ses problématiques, son histoire et son évolution, sans en faire un état de l'art complet. Le point de vue de l'auteur sur ce domaine pluridisciplinaire est celui d'un enseignant-chercheur en intelligence artificielle ; cette présentation est donc, bien sûr, partielle et partiale.
Ce domaine s'est développé depuis 1970 environ aux Etats-Unis, et depuis le début des années 80 en France, sous l'appellation initiale d'"Enseignement Intelligemment Assisté par Ordinateur" (traduction de "Intelligent Computer Aided Instruction"). A partir du constat de certaines limites des systèmes d'EAO classiques, il s'agissait de réaliser, en utilisant des techniques d'intelligence artificielle, des systèmes plus souples, plus interactifs, s'adaptant mieux à leur utilisateur (1) pour l'aider à apprendre.
Plusieurs approches ont été explorées. La décennie 80-90 a été marquée par celle des "systèmes tutoriels intelligents", fortement liée au développement des "systèmes à base de connaissances" en intelligence artificielle. Elle s'est terminée par un changement d'appellation pour le sigle EIAO, développé en "Environnements Interactifs d'Apprentissage avec Ordinateur", correspondant à l'appellation en langue anglaise "Interactive Learning Environments". Le caractère pluridisciplinaire de ce domaine de recherche s'est fortement confirmé, des communautés nationale et internationale se sont constituées.
Après une présentation générale de ce domaine, j'essaierai de donner un aperçu des diverses problématiques étudiées, des difficultés rencontrées et de l'évolution des idées en EIAO.
Un aperçu général du domaine EIAO
Les débuts de l'"Enseignement Intelligemment Assisté par Ordinateur"
On situe généralement les débuts de l'EIAO aux États-Unis, avec le célèbre système SCHOLAR de Carbonell, relatif à la géographie de l'Amérique du Sud. Dans ce système de "dialogue à initiative mixte", la connaissance représentée dans des "structures d'information" était utilisée non seulement pour être présentée, pour déterminer des questions à poser à l'apprenant et pour vérifier ses réponses, mais aussi pour répondre à des questions de ce dernier non explicitement prévues à la conception du système (2), et ce en "langage naturel" (anglais limité à des phrases simples). Plus précisément, Carbonell avait représenté des objets et concepts géographiques dans une structure globale organisée sous forme de "réseaux sémantiques", réseaux d'entités reliées entre elles par des relations. Sur la base de la plausibilité psychologique alors attribuée aux réseaux sémantiques comme modèles de représentation et de mémorisation de connaissances par les humains, à la suite des travaux de Quillian, Carbonell avait aussi doté SCHOLAR de capacités embryonnaires de "modélisation de l'apprenant", plus précisément d'un mécanisme d'évaluation des connaissances de celui-ci, sous la forme de valeurs attachées aux noeuds du réseau. Outre le caractère attractif d'un tel système de dialogue pour l'apprenant, qui pouvait prendre l'initiative de poser des questions, Carbonell pensait qu'une telle approche était aussi plus attrayante pour les enseignants impliqués dans la conception du système, puisqu'au lieu d'avoir à découper la connaissance en items à intégrer précisément dans des scénarios séquentiels, comme c'était le cas en EAO classique, ils avaient à représenter les connaissances du domaine dans le cadre d'une structure conceptuelle globale et à définir des stratégies tutorielles, en termes de modes de parcours de cette structure, visant à permettre l'acquisition par l'élève de la connaissance ainsi représentée.
On trouve dans ces travaux précurseurs et dans ceux qui ont suivi dans la décennie 70 les idées fondamentales de l'EIAO :
- une représentation explicite des connaissances du domaine et de mécanismes de raisonnement, qui dotent le système de la capacité de répondre à des questions, de résoudre des exercices dont la solution n'a pas été explicitement prévue et dont l'énoncé peut être proposé par l'apprenant,
- un processus de "modélisation de l'apprenant", visant à disposer explicitement d'informations telles que son degré de maîtrise des connaissances du domaine, l'objectif général étant de permettre une adaptation dynamique et individualisée du système à son interlocuteur,
- l'explicitation de stratégies tutorielles, pour permettre au système d'engendrer dynamiquement ses interventions en fonction de la situation, d'objectifs pédagogiques et du modèle de l'apprenant,
- la recherche de capacités de communication souples et variées, avec des possibilités d'intervention et de prise d'initiative de l'apprenant.
Ces idées justifient l'adverbe "intelligemment", ajouté au sigle EAO, à la fois en terme d'"intelligence" du système et en terme de problématiques et de techniques relevant de l'intelligence artificielle. Elles ont donné lieu à des travaux de recherche divers, surtout depuis la fin des années 70, et en France en particulier à partir du début des années 80. Le lecteur intéressé trouvera dans l'ouvrage de E. Wenger [Wenger 87] une présentation détaillée des travaux anglophones antérieurs à 1987 et des considérations générales dont l'intérêt dépasse largement cette date.
1980-90 : la décennie des "Systèmes Tutoriels Intelligents" (STI)
Le paradigme des STI a été dominant dans la décennie 80-90 en EIAO, en liaison très forte avec le développement en IA des "systèmes à base de connaissances", en particulier des premiers "systèmes experts", sur le modèle du système GUIDON réalisé par W.J. Clancey à la fin des années 70. L'idée initiale était simple : si on dispose d'un système de résolution de problèmes de niveau expert (3), avec une base de connaissances explicites, on peut l'utiliser pour former des étudiants, en lui ajoutant des modules adéquats pour assurer le "transfert" de ces connaissances et de cette compétence du système vers l'étudiant.
Il s'agissait principalement de concevoir ainsi des systèmes d'apprentissage individualisé, fondés sur des activités de résolution de problèmes, ces activités étant généralement considérées comme complémentaires d'un enseignement du domaine effectué par ailleurs (cours magistral par exemple, ou bien autre type d'environnement informatique). Dans un STI, la résolution d'un problème proposé par le système ou par l'apprenant peut en principe être effectuée ou bien par le système, avec certaines capacités d'explication, dans un mode "observation" pour l'apprenant, ou bien par l'apprenant, dans un mode "action", avec un guidage et un contrôle plus ou moins rapprochés du système. C'est le cas par exemple du système APLUSIX, dans le domaine de la factorisation de polynômes aux niveaux collège et lycée, dont la première version date de 1987 [Nicaud 87], et du système QUIZ, pour l'enseignement du jeu de la carte au bridge, de J.M. Labat et M. Futtersack.
L'architecture générale complète proposée classiquement pour un STI comporte quatre macro-composants interdépendants : le module "représentation du domaine" (appelé initialement "module expert"), le module "modèle de l'élève", le module tutoriel (ou "pédagogue") et le module d'interface, ce dernier étant plus ou moins distingué du module tutoriel selon les systèmes. La conception de chacun de ces modules, avec la précision de leurs fonctionnalités et de leurs liens, a posé un certain nombre de problèmes, de même que leur intégration dans une architecture informatique adaptée, abordée parfois en termes de système multiagents.
Je reviendrai dans la section 3 sur ces différents modules et sur quelques-uns des problèmes rencontrés. Le lecteur qui souhaiterait avoir plus de détails sur les principes des STI et sur leur illustration par des exemples dans différents domaines peut consulter [Wenger 87], [Nicaud & Vivet 88], [Quéré & al. 91], ainsi que les actes des deux éditions du congrès spécifique "International Conference on Intelligent Tutoring Systems" [ITS 88] et [ITS 92].
De l'EIAO aux EIAO : "Environnements Interactifs d'Apprentissage avec Ordinateur"
C'est aussi au cours de la décennie 80-90 que s'est développé l'usage des micro-ordinateurs et des stations de travail individuelles, avec une évolution rapide des matériels, des logiciels et des interfaces de communication homme-machine, tous ces éléments permettant d'envisager une interactivité système-utilisateur croissante.
On est alors passé en informatique en général, et en IA en particulier, de l'idée de systèmes de résolution de problèmes, où les échanges avec l'utilisateur se limitaient à la saisie des données et à la fourniture des résultats, à celle de "systèmes interactifs" d'aide à la résolution de problèmes, d'aide à la décision, ou au contrôle d'un processus industriel, par exemple, avec une communication plus intense tout au long du processus.
C'est aux environs de 1990 qu'un détournement du sigle EIAO, qui avait alors peu à peu tendance, pour certains, à se limiter aux travaux de recherche relatifs aux STI, a amené à l'emploi de l'appellation actuelle "Environnements Interactifs d'Apprentissage avec Ordinateur" (4), qui mérite quelques explications. Elle renvoie à une vision constructiviste de l'apprentissage, selon laquelle l'apprenant construit ses connaissances en interagissant avec un milieu (au sens didactique du terme) ou environnement, ce qui donne à l'apprenant et à son apprentissage le premier rôle, aux dépens de la vision "transfert de connaissances" de l'enseignant à l'enseigné. Cette appellation permet ainsi d'évoquer un "environnement d'apprentissage" qui peut être plus large que le système informatique proprement dit.
Elle permet aussi de regrouper sous un même sigle des approches autres que celle des STI au sens strict (5), avec d'autres objectifs en terme de situations et de formes d'activités proposées aux apprenants, le point commun étant des capacités d'interactivité intentionnellement destinées à favoriser des apprentissages de l'utilisateur, dans un cadre d'utilisation relativement autonome. Par exemple le système SIAM de J. Courtois, système d'assistance à des activités de travaux pratiques de physique, aide un étudiant à comprendre pourquoi le montage qu'il a réalisé ne se comporte pas comme prévu (situation indirecte de résolution de problèmes de diagnostic). D'autres systèmes comportent un module important de simulation de dispositifs techniques, sur lequel sont basées des activités de formation, dans des domaines des sciences expérimentales par exemple, ou en formation professionnelle. D'autres approches encore sont basées sur des "micromondes" ou sur des environnements d'exploration, de découverte plus ou moins guidée.
Il convient cependant de préciser des limites : tout micromonde, tout environnement de simulation ou d'exploration ne relève pas de l'appellation EIAO. Ainsi, certains de ces environnements sont simplement réactifs, c'est-à-dire qu'ils ne font qu'exécuter des commandes de leur utilisateur, sans effectuer de contrôle de celui-ci, ni d'intervention tutorielle ; ceci ne signifie pas qu'ils ne peuvent pas être utilisés dans un contexte de formation, et que l'on ne peut apprendre en les utilisant. Par exemple l'environnement LOGO, considéré comme un prototype de micromonde, a été développé par S. Papert et largement expérimenté dans les années 80 dans des contextes scolaires (niveau primaire ou collège) ; l'objectif pédagogique annoncé était de développer des capacités de découverte, en proposant aux élèves un dispositif mobile matériel ou abstrait (tortue ou écran graphique) réagissant à des commandes formulées au moyen d'un programme en langage LOGO. Beaucoup d'études et d'expérimentations ont été menées pour préciser des situations d'usage et analyser les apprentissages résultant effectivement de telles activités, reprises et étendues à d'autres dispositifs dans le champ de la robotique pédagogique. Un autre exemple de micromonde réactif est le système CABRI-Géomètre ("cahier de brouillon" en géométrie) qui permet, via l'utilisation d'un ensemble de commandes symboliques et d'opérations de manipulation directe, de construire une figure géométrique, puis de la déformer en maintenant les relations déclarées entre ses éléments (un point déclaré sur une droite reste sur la droite, le point milieu d'un segment reste au milieu du segment si ses extrémités se déplacent, par exemple). On conçoit aisément l'intérêt d'un tel environnement pour l'étude de figures, de propriétés géométriques et la formulation de conjectures, intérêt d'ailleurs attesté par les nombreuses expérimentations de ce système. De même, nombre de modules de simulation de phénomènes ou de dispositifs peuvent être employés dans des situations de formation, tout en n'ayant que des capacités réactives : l'apprenant fixe des valeurs de paramètres et peut observer le comportement résultant du modèle simulé. On peut aussi classer dans la catégorie des environnements réactifs des systèmes hypertextes ou hypermédias, qui répondent à des demandes d'accès de leur utilisateur à telle ou telle partie des informations enregistrées [Vétois 93] [Bruillard & Passardière 94].
Ces divers systèmes d'exploration libre ont connu une certaine vogue, avec des conceptions de l'apprentissage basées sur la métaphore du "libre-service", où l'apprenant est sensé prendre lui-même ce dont il a besoin. Des expérimentations ont permis de constater que de tels environnements réactifs supposent, si un minimum d'efficacité et de contrôle des apprentissages est souhaité, soit une utilisation fortement intégrée à un dispositif de formation externe et contrôlée par un enseignant humain, par exemple en classe ou dans des situations de type travaux pratiques, soit une certaine capacité de l'utilisateur à gérer lui-même son apprentissage. Depuis plusieurs années d'ailleurs, des projets ont pour objectif de compléter de tels systèmes avec des modules assurant des tâches de guidage tutoriel et de contrôle des activités de l'apprenant, pour en faire des EIAO.
Il n'est pas question de dire que les EIAO sont la seule voie acceptable ; on peut penser au contraire que, selon les domaines, les types d'apprentissage, les types d'apprenants et les situations de formation visés, il y a des réponses multiples, et que des systèmes informatiques d'autres types que des EIAO ont leur intérêt.
Un domaine pluridisciplinaire
Étant donné les problématiques explorées pour les EIAO, leur conception relève encore par plusieurs aspects de la recherche en intelligence artificielle ; elle relève aussi d'autres disciplines de recherche, telles que la didactique (ou plutôt les didactiques des disciplines), la psychologie cognitive et les sciences de l'éducation. La coopération de ces diverses disciplines s'est en effet avérée nécessaire pour progresser dans la conception des divers modules, pour élaborer et implanter des modèles ayant une certaine pertinence, pour progresser vers la mise au point de méthodologies de conception et d'expérimentation, qui posent encore des problèmes délicats, voire pour imaginer de nouveaux paradigmes, comme l'apprentissage par collaboration avec un co-apprenant artificiel.
Les actes des journées francophones EIAO, dont trois éditions ont paru en 1989, 91 et 93 respectivement (6) ([EIAO 89], [EIAO 91], [EIAO 93]), témoignent de l'affirmation du caractère pluridisciplinaire du domaine et de la diversité des travaux francophones, de même que le dossier "EIAO" réalisé en 1992 pour le bulletin de l'Association Française pour l'Intelligence Artificielle [AFIA 92] ; celui-ci contient, outre une présentation pluridisciplinaire du domaine et de nombreuses références générales, un panorama relativement récent des projets de recherche en France.
Sur le plan international, le thème EIAO relève du TC3 de l'IFIP. Par ailleurs, une association spécifique "Artificial Intelligence in Education" a été constituée au sein de l'AACE (Association for the Advancement of Computing in Education) ; elle édite une revue (Journal of AI in Education) et organise une conférence internationale, dont la plus récente a eu lieu en août 93 [AI-ED 93].
Retour sur les modules des STI : de quelques difficultés et de l'évolution des idées.
L'EIAO s'est révélé au cours de la décennie 80-90, outre un domaine de recherche fortement pluridisciplinaire, comme il vient d'être dit, un domaine particulièrement intéressant d'émergence et d'approfondissement de problématiques, de mise en oeuvre et d'intégration de techniques relevant de différents champs de l'IA, qu'il s'agisse de représentation de connaissances, de modélisation de raisonnements, de modélisation d'agents, d'architecture de systèmes multiagents, d'apprentissage-machine et de communication homme-machine. Au fur et à mesure des réalisations et des expérimentations, un certain nombre de problèmes ont amené à des prises de conscience de difficultés multiples et à l'évolution de certaines idées, un peu trop optimistes ou naïves au départ, en IA ou en EIAO.
Le module "Domaine"
Dans l'euphorie des premiers systèmes experts, on a pensé qu'il suffisait de représenter les connaissances du domaine par une "base de connaissances déclaratives", recueillie auprès d'un expert du domaine, et de concevoir autour de cette base des composants ayant les diverses fonctionnalités voulues dans un STI : résolution des problèmes du domaine, explications sur la résolution (ces deux fonctionnalités étant usuellement attendues d'un système expert), présentation des connaissances, suivi de la résolution proposée par l'apprenant, aide, génération d'exercices.
Cette approche souscrivait à l'idée de la réutilisabilité chère aux informaticiens : les connaissances une fois formulées pourraient être utilisées de diverses façons, par un ou plusieurs modules assurant de manière générique les fonctionnalités voulues, ces modules génériques pouvant être eux aussi réutilisés dans d'autres domaines. Si des systèmes ont effectivement été réalisés selon ces idées, on a constaté plusieurs difficultés.
Quel modèle de résolution de problèmes pour un STI ?
Une des premières constatations est qu'un bon "système expert" n'est pas nécessairement un bon "module domaine" pour un STI : les objectifs de modélisation et les critères d'évaluation ne sont pas les mêmes. La modélisation réalisée dans les premiers systèmes experts, si elle a donné satisfaction pour simuler un comportement expert ou pour servir dans un contexte d'aide à la résolution de problèmes pour un quasi-spécialiste, s'est révélée non adaptée à un utilisateur "novice" dans un contexte de formation : connaissances explicitées non compréhensibles, connaissances intéressantes non explicitées, inadaptation du niveau de détail, de la méthode de résolution, ou des explications. C'est le constat que Clancey a fait avec GUIDON et qui l'a amené à proposer une reconception du module domaine MYCIN, une reformulation des connaissances, une révision et une explicitation du raisonnement de diagnostic qui était d'une part implicite et, d'autre part, peu conforme au processus de raisonnement des experts, bien que donnant des résultats semblables. Il ne suffit pas en effet de fournir un résultat final ou une solution, il faut pouvoir expliciter, à certains niveaux de détail, le processus de résolution sur lequel sont basés plusieurs aspects de la communication STI-apprenant : présentation, explications, suivi de l'apprenant, aide.
On est ainsi passé de l'idée initiale de "module expert" à celle de "résolveur pédagogique" [Nicaud 87] (ou d'"élève idéal", selon Anderson, dans les ACTP-Tutors), susceptible de fournir des résolutions et des explications adaptées au niveau d'apprentissage visé, comme peut le faire un enseignant, la notion de "connaissances expertes" étant remplacée par celle de "connaissances de référence". Il s'agit donc de concevoir un modèle de comportement de résolution de problèmes, en explicitant le plus possible les connaissances en jeu, qui résolve une certaine classe de problèmes, et qui satisfasse des exigences à la fois d'ordre computationnel, d'ordre cognitif et d'ordre didactique. La difficulté de ce problème de modélisation est généralement largement sous-estimée. En effet, même dans des domaines réputés bien formalisés, il y a souvent loin des connaissances reconnues comme correctes et qui sont enseignées explicitement (définitions et théorèmes en mathématiques, théories en physique par exemple), aux connaissances déclaratives en général, à ce qu'il faut savoir et savoir faire pour résoudre effectivement des problèmes.
Difficulté du recueil de connaissances et de savoir faire.
Qu'il s'agisse de connaissances expertes ou de connaissances de référence, il n'est pas évident de recueillir de telles connaissances auprès d'un individu plus ou moins expert : un individu peut avoir de bonnes performances en résolution de problèmes dans un domaine sans pouvoir expliciter en détail la façon dont il procède, les éléments précis qu'il prend en considération, et les règles plus ou moins générales selon lesquelles il raisonne. Cette constatation générale en IA a été faite aussi en EIAO pour le recueil de connaissances auprès d'enseignants, tant pour la conception du module résolveur que pour celle du module tutoriel.
Un domaine spécifique s'est développé depuis moins d'une dizaine d'années en IA sous l'appellation "acquisition de connaissances". Des méthodes et des outils destinés à faciliter la conception de systèmes à base de connaissances y sont élaborés, en liaison avec des travaux de psychologie cognitive, situant de plus en plus le recueil de connaissances dans le cadre d'une activité de modélisation.
Quels éléments peut-on expliciter dans un contexte d'enseignement ? Lesquels convient-il d'expliciter, selon les objectifs d'apprentisage ? Comment les organiser dans un modèle ? Quels modèles sont utiles et acceptables dans un EIAO, du point de vue des contenus disciplinaires, mais aussi en fonction de critères informatiques liés aux ressources de calcul, importants pour des systèmes interactifs ? Ce sont des questions fondamentales pour l'approche des STI ; les réponses nécessitent à l'évidence une coopération pluridisciplinaire.
Modèle évolutif
Une autre dimension est aussi à prendre en considération en EIAO ; c'est l'évolution nécessaire des connaissances de référence et du comportement du résolveur, au fur et à mesure de la progression (souhaitée!) de l'apprenant. Il ne s'agit certes pas de concevoir un système unique qui accompagnerait un apprenant "de 7 à 77 ans", pour reprendre une formule bien connue, mais qui pourrait le suivre de manière cohérente dans un domaine de problèmes donné, sur plusieurs sessions.
Ainsi, certaines étapes de résolution qui au début doivent être explicitées soigneusement (en mathématiques par exemple), ne nécessitent plus de l'être après quelques exercices correctement effectués. Sur un laps de temps plus important, c'est aussi de nouvelles connaissances plus ou moins liées aux précédentes, une réorganisation des connaissances, une terminologie nouvelle, qu'il convient d'utiliser. Comment concevoir ainsi des modèles "à comportement variable", ou des successions de modèles, qui soient adaptés à différents stades d'apprentissage ? C'est un problème qui concerne la didactique de la discipline concernée et la psychologie cognitive, pour ce qui est des contenus, mais qui pose des problèmes de représentation et de réalisation aux informaticiens. Par exemple, sur les traces du système Wumpus de I. Goldstein, qui proposait une organisation des connaissances dans un réseau "génétique" (où les arcs entre items de connaissance sont étiquetés par des relations liées à l'apprentissage), J. F. Nicaud a proposé de concevoir des "réseaux de référence", dont les noeuds sont des états de connaissance et dont les arcs sont étiquetés par des processus d'acquisition. Dans le projet QUEST, concernant l'électricité, une progression de modèles est étudiée. Dans le projet Mémolab, concernant l'expérimentation en psychologie, le principe de "language shift" vise une progression de la terminologie utilisée par l'apprenant au niveau du langage de commande.
Des approches relativement récentes de la résolution de problèmes en IA font intervenir les problèmes précédemment résolus, intégrant ainsi un processus d'apprentissage ; c'est le cas de la résolution de problèmes par analogie, du raisonnement à base de cas, ou bien de l'apprentissage de connaissances de résolution à partir de l'analyse des solutions d'exercices résolus. Ainsi la vision des connaissances et de la compétence de résolution de problèmes tend à devenir de plus en plus dynamique, les connaissances pouvant évoluer, s'enrichir, se réorganiser à chaque nouveau problème traité.
Capacités d'explication
De bonnes capacités d'explication sur la résolution nécessitent de pouvoir répondre à plusieurs types de questions, portant sur le contenu des connaissances, sur les résultats obtenus, sur le raisonnement suivi, sur les choix stratégiques, et ce de manière adaptée à l'utilisateur et au contexte des questions. Les nombreux travaux en IA sur ce sujet ont montré que, d'une part, les capacités d'explication sont étroitement liées à la modélisation du résolveur, aux connaissances qui y sont explicitées, et que d'autre part, elles nécessitent des connaissances complémentaires et des modes de raisonnement spécifiques. Un des aspects reconnus comme délicat est l'adaptation à l'utilisateur, problème particulièrement crucial et identifié depuis longtemps en EIAO.
Si les capacités d'explication semblent indispensables dans une situation d'apprentissage, les besoins spécifiques d'explication sont à préciser selon les domaines et les types d'activités envisagés et mériteraient des études et des expérimentations plus nombreuses. Un apprenant peut souhaiter avoir des explications non seulement sur la résolution du problème posé et sur les connaissances du domaine, mais aussi sur d'autres aspects de son interaction avec le système, par exemple sur la conduite de la session, l'activité proposée, le style tutoriel utilisé.
Le module "modèle de l'apprenant"
L'appellation "modèle de l'apprenant" a fait couler beaucoup d'encre et suscité beaucoup de malentendus. Peut-être est-ce parce qu'elle regroupe des travaux dont les objectifs ont été très divers, parfois ambitieux, et pas toujours clairement énoncés.
Réalisation d'un modèle de l'apprenant dans un EIAO
Dans un EIAO, l'objectif est de disposer d'un ensemble d'informations sur l'apprenant, principalement sur l'état de ses connaissances (modèle épistémique) et sur l'historique de ses interactions avec le système pour une adaptation dynamique et individualisée des interventions du système à son interlocuteur. On retrouve de plus en plus cette problématique dans la conception de systèmes interactifs, des systèmes documentaires par exemple, où plusieurs catégories d'utilisateurs sont visées et où une certaine adaptation du système à l'utilisateur est souhaitée.
Suivant des considérations plus ou moins pragmatiques, des approches ont proposé des modèles de type "expertise partielle" (ou "overlay"), en interprétant un comportement différent de celui du résolveur en terme de connaissance incomplète : un apprenant peut manquer de certains éléments de connaissance du domaine, ou en avoir une maîtrise plus ou moins confirmée ; celle-ci peut être évaluée par des degrés symboliques (pas du tout, un peu, bien, ou très bien par exemple) ou des coefficients numériques, et peut évoluer au fur et à mesure des interactions.
D'autres approches, à la suite du système BUGGY de J. S. Brown et R. Burton, se sont focalisées sur l'explication des erreurs en termes de "bugs", qui correspondent dans un modèle comportemental procédural à des sous-procédures ou des règles incorrectes ; pour des incorrections dans les connaissances conceptuelles, on parle de "misconceptions". Ces travaux ont eu pour intérêt, entre autres mérites, d'attirer l'attention sur l'importance des erreurs et de leur traitement en phase d'apprentissage. Si dans certains projets des catalogues de bugs ont été collectés "à la main", dans d'autres on a cherché à les obtenir automatiquement. Une approche originale a été celle de K. VanLehn avec une théorie générative (Repair Theory), qui propose d'expliquer comment un apprenant qui se trouve dans une impasse, c'est-à-dire une situation pour le traitement de laquelle il ne dispose pas de connaissance, invente un "dépannage", ce qui crée un bug.
Des approches mixtes ont combiné les deux types de modèles, connaissances partielles et bugs. La constitution et la tenue à jour par le système d'un modèle de l'apprenant constituent la fonction du module de diagnostic, parfois qualifié de cognitif.
Modélisation du comportement de résolution de problèmes d'apprenants
Certains travaux se sont fixé comme objectif premier de tester des hypothèses de psychologie cognitive pour la modélisation de comportements de résolution produits par des élèves, sans viser une utilisation précise directe du modèle dans un EIAO. Ils ont proposé des modèles rendant compte des erreurs commises par les élèves, avec des degrés divers d'explicitation de connaissances, de mécanismes de raisonnement, et de capacités métacognitives. Un des modèles les plus élaborés est celui expérimenté dans le projet pluridisciplinaire Electre, qui a porté sur la reconnaissance de circuits électriques (en série ou en parallèle), avec une architecture cognitive complexe explicitant des connaissances conceptuelles (sous forme de prototypes et de schémas), des heuristiques de catégorisation des problèmes, et des métaconnaissances relatives aux stratégies de parcours des connaissances en situation de résolution.
L'évaluation de ces travaux de modélisation cognitive repose sur le degré d'explicitation des connaissances en jeu, sur la conformité des résultats, obtenus par simulation, aux protocoles d'élèves analysés, sur la valeur explicative et prédictive des modèles.
D'autres travaux ont également mis l'accent sur l'organisation de différents niveaux de connaissances dans le modèle de l'apprenant, en particulier les propositions de formalisation de J. Self, en termes de systèmes de croyances dans un cadre de logiques épistémiques, pour analyser les travaux et les problèmes de modélisation de l'apprenant.
Modélisation du diagnostic
Le problème du diagnostic automatique est d'inférer les informations du modèle de l'apprenant à partir de ce qui est perçu du comportement de celui-ci, c'est-à-dire d'effectuer une analyse et une interprétation du comportement de l'apprenant. Les travaux qui s'y rattachent n'ont pas tous visé une utilisation "en-ligne", en cours de session, ni un modèle d'apprenant très complet. Ils peuvent être classés selon différents aspects : le mode (en-ligne ou hors-session, suivi pas à pas ou analysé a posteriori), les données d'entrées traitées (résultat final ou traces détaillées de raisonnement, données concernant un exercice ou un ensemble de tests), les sorties visées (quels types de connaissances, quel modèle d'apprenant), les techniques employées pour inférer les sorties à partir des entrées. La plupart des approches de diagnostic utilisent des techniques de comparaison des comportements de résolution de l'apprenant et du résolveur, et des techniques de "perturbation" de ce dernier, pour en obtenir une variante plus ou moins partielle ou erronée. Parmi celles-ci, on peut citer les techniques de reconnaissance de plans ou d'intentions, associées à une modélisation du comportement de résolution en terme de planification, des techniques d'apprentissage ainsi que des approches de "diagnostic à base de modèles". L'intégration d'un processus de diagnostic en-ligne dans un EIAO, exploitant les traces du comportement de l'apprenant au fur et à mesure des interactions, suppose, outre des temps d'exécution raisonnables, une prise en compte de l'évolution de l'apprenant, problème actuellement peu abordé.
Modélisation de l'apprentissage, apprenant artificiel
Dans des travaux récents, K. VanLehn propose une problématique d'apprenant artificiel "guidé par instruction" ; l'idée est de modéliser l'apprentissage d'un apprenant qui suit une séquence de "leçons", une leçon étant un ensemble d'exemples et d'exercices. Un tel agent artificiel pourrait être utilisé pour tester des séquences d'enseignement, ou bien comme co-apprenant artificiel, dans le cadre d'approches qui s'inspirent d'une conception plus sociale de l'apprentissage que celle d'une situation individuelle, ou qui essaient de se passer d'un module résolveur.
Conclusion sur la modélisation de l'apprenant
Si les différents types de travaux relatifs à la modélisation de l'apprenant ont permis de tester des hypothèses sur les processus humains de résolution de problèmes et d'apprentissage, ainsi que des techniques pour les représenter et les diagnostiquer, on constate un certain paradoxe à propos du modèle de l'apprenant en EIAO : il semble qu'on ne puisse s'en passer, pour garantir l'adaptabilité du système à son interlocuteur, mais il semble difficile de modéliser finement des états aussi instables que ceux d'un apprenant et d'en réaliser un diagnostic en cours de session. Le problème est de trouver un compromis acceptable, selon les objectifs du système considéré et l'utilisation effective des informations du modèle de l'apprenant, et de concevoir des interfaces qui permettent le recueil d'informations pertinentes sur le raisonnement suivi par l'apprenant.
La communication apprenant-EIAO
On peut regrouper en termes de communication apprenant-EIAO les problèmes relatifs au module tutoriel et au module interface, dont les fonctions sont plus ou moins clairement distinguées selon les travaux. Le module tutoriel a un rôle central dans un STI : il modélise un comportement de "précepteur", il gère le déroulement global de la session en faisant appel aux autres modules. La fonction du module interface concerne plutôt la gestion des supports et les modes de communication système-apprenant.
Stratégies tutorielles, planification pédagogique, modèles de dialogues
Les travaux relatifs au module tutoriel se sont attachés à différents aspects : conduite pédagogique de la session, gestion du curriculum, suivi des activités, décisions et contenus des interventions du système ; ils ont proposé différents styles de guidage et de contrôle, l'explicitation de plans pédagogiques, de règles et de stratégies tutorielles, et ont expérimenté diverses techniques de réalisation (voir par exemple le système QUIZ, déjà mentionné).
Peu à peu est apparue la notion de modèle de dialogue, en un sens non restreint au langage naturel, en liaison avec d'autres travaux en communication homme-machine et en linguistique, comme cadre global des interactions apprenant-système. Les notions de négociation et d'argumentation y interviennent de manière importante [Baker 91], certains travaux étant inspirés par les principes du célèbre dialogue socratique, ainsi que par des travaux en didactique. Par ailleurs, des approches de modélisation d'interactions à but d'apprentissage entre agents humains et artificiels ont été proposées en apprentissage-machine. Il conviendrait d'étudier davantage les spécificités des interactions EIAO-apprenant.
Les EIAO : des systèmes interactifs coopératifs
On peut considérer un EIAO comme un système coopératif d'aide à l'apprentissage. L'aide est destinée à l'apprenant-utilisateur, l'apprentissage concerne des processus cognitifs internes à ce dernier ; si l'on utilise une métaphore de contrôle de processus, l'apprenant est à la fois le "dispositif" et un opérateur des processus d'apprentissage ; la coopération de l'EIAO porte au premier plan sur la tâche d'apprentissage, pour laquelle sont proposés des objectifs, des activités supposées favorisantes, et des interventions de pilotage et de contrôle, tout ceci relevant de la fonction tutorielle. Ainsi dans un STI, comme on l'a vu plus haut, on considère que l'apprentissage peut être favorisé par des activités de résolution de problèmes ; les objectifs d'apprentissage peuvent concerner les connaissances de base du domaine et la capacité à les mettre en oeuvre. Les activités nécessaires à la résolution du problème posé peuvent, à un niveau secondaire de coopération, être partagées entre le système et l'apprenant, le partage étant déterminé par les objectifs d'apprentissage visés plutôt que par l'objectif de résolution efficace du problème ; par exemple dans APLUSIX, où l'objectif est d'exercer l'apprenant à réfléchir sur les stratégies de résolution, c'est à lui que revient le choix de la transformation à appliquer à une étape, mais l'application et les calculs qui s'y rapportent sont effectués par le système. A un autre niveau d'apprentissage, avec d'autres objectifs, le partage des tâches pourrait être différent, inversé par exemple, ce qui modifierait en conséquence les tâches de contrôle du système. Selon les systèmes, l'aspect coopératif est plus ou moins important et le partage des tâches variable, à chacun des deux niveaux distingués ci-dessus ; les types d'interaction système-apprenant sont dépendants de l'objectif d'apprentissage, et par là spécifiques en EIAO.
Importance des interfaces
La communication système-apprenant passe par des dispositifs d'interface, qui ont un rôle très important dans un EIAO : les activités et les formes de communication proposées à l'apprenant sont des éléments déterminants pour ses apprentissages. Par exemple les représentations utilisées à l'écran, qu'il s'agisse de présentation de connaissances, de représentation d'objets et de concepts du domaine, de présentation de la résolution d'un problème, de "réification" de concepts abstraits ou de raisonnements, sont particulièrement cruciales pour la communication et la coopération en phase d'apprentissage, comme elles le sont en général dans les systèmes coopératifs d'aide, ainsi que le montrent des études de psychologie et d'ergonomie cognitives.
Toutes les techniques de communication homme-machine sont à prendre en considération en EIAO, qu'elles utilisent le langage naturel écrit plus ou moins restreint, un langage de commande ou des menus, des icônes et des représentations graphiques avec des possibilités de manipulation plus ou moins directe des représentations à l'écran, l'image ou le son, dans le cadre de systèmes multimédias et d'interfaces multimodales. Les possibilités offertes par ces techniques, leurs limites, leur adaptation aux situations d'apprentissage sont à expérimenter soigneusement.
On peut rêver d'un EIAO doté de capacités de synthèse et de reconnaissance de la parole, qui dialoguerait oralement avec l'apprenant en langage naturel, pour l'apprentissage des langues en particulier, mais ce n'est encore qu'un rêve...
Conclusion
Ainsi l'EIAO est un domaine fondamentalement pluridisciplinaire visant la conception d'environnements d'apprentissage généralement individuels, c'est-à-dire de systèmes interactifs complexes qui nécessitent l'élaboration et l'intégration de divers modèles relevant de disciplines telles que la didactique, la psychologie, les sciences de la communication, l'IA et l'informatique. Les approches et les problèmes évoqués dans cet article, en particulier en ce qui concerne la modélisation de connaissances et de raisonnements, ainsi que la communication homme-machine, montrent les liens de ce domaine avec des problématiques actuelles en intelligence artificielle et en sciences cognitives. Si les disciplines de recherche concernées ont engagé depuis plusieurs années des échanges et des collaborations dans le cadre de groupes de travail, de projets ou de publications, elles en sont encore à préciser leurs intérêts, les apports possibles et les limites de leur intervention en EIAO, ainsi que les modalités d'une coopération dont le principe est de mieux en mieux accepté par les disciplines, sinon reconnu institutionnellement.
Remerciements
Les idées exprimées dans cet article doivent beaucoup aux nombreux échanges auxquels j'ai pu participer dans le cadre de plusieurs groupes de travail, en particulier le groupe Mandrin (89-91, projet PIRTTEM-CNRS), le groupe Math & Méta (90-92, Atelier "Systèmes à base de connaissances et enseignement" du GDR Sciences Cognitives Paris-Centre), l'équipe APLUSIX (LRI, Université Paris-Sud), et le groupe EIAO du PRC-IA (89-94).

Notes

  1. l'utilisateur final considéré ici sera désigné par le terme générique "apprenant".
  2. SCHOLAR a même été un des premiers systèmes d'IA à proposer une modélisation de raisonnement par défaut, en raisonnant sur l'absence d'informations dans le réseau pour répondre à des questions .
  3. il s'agissait dans le cas de GUIDON du système expert MYCIN, pour le diagnostic de maladies infectieuses et leur traitement par des antibiotiques.
  4. voir, en langue anglaise, le sigle ILE, pour "Interactive Learning Environments".
  5. on parlera de l'EIAO pour le domaine, d'un EIAO pour un environnement, ou des EIAO en général.
  6. dans le cadre des activités du PRC-GDR Intelligence Artificielle et, pour les deux plus récentes, du GR Didactique et Acquisition des disciplines scientifiques, les GR et GDR étant des groupements de recherche du CNRS, les PRC (Programmes de Recherche Coordonnées) ayant été conçus et financé par le MRT (Ministère de la Recherche et de la Technologie).

Bibliographie