Tricot, A. (1998). Charge cognitive et apprentissage. Une présentation des travaux de John Sweller. Revue de Psychologie de l’Éducation, 3, 37-64.

 

 

 

 

 

 

Charge cognitive et apprentissage. Une présentation des travaux de John Sweller

 

 

 

 

 

Introduction

John Sweller est professeur en éducation à l’Université de New South Wales, à Sydney en Australie, où, depuis le début des années 70, il a passé quasiment toute sa carrière. Ses 51 publications dans des revues à referees ont été citées plusieurs centaines de fois dans des articles et des ouvrages importants, et sont à la base de travaux de nombreuses équipes de recherches en Europe et aux Etats-Unis. Parmi les revues qui ont publié le plus de ses articles, on trouve le Journal of Experimental Psychology (7 articles), le Journal of Educational Psychology (6 articles), Cognition and Instruction (6 articles), le American Journal of Psychology (3 articles), le Journal for Research in Mathematics Education (3 articles), Psychological Reports (3 articles), ainsi que le Quarterly Journal of Experimental Psychology (3 articles). L’importance des travaux de Sweller est manifeste au niveau théorique (il est l’auteur de la théorie de la charge cognitive la plus précise, il a contribué à faire mieux connaître la mémoire de travail et l’apprentissage par l’action), mais aussi au niveau pratique (il a défini cinq règles majeures de la conception de situations d’apprentissage).

John Sweller consacre ses travaux aux effets de la structure du but et de la présentation de la situation à traiter sur la charge cognitive et sur l'apprentissage. L’objectif de cet article est de présenter succinctement l’évolution de ses recherches, et les principaux résultats qu’il a obtenus. Dans la première partie, nous évoquons un premier aspect de ses travaux, consacré aux effets de la structure du but sur la charge cognitive et l'apprentissage. Cette première phase des travaux de Sweller date de la fin des années 70 et du début des années 80 ; elle a manifestement pour but la remise en cause de l'analyse moyens-fins comme modèle hégémonique du traitement de l'information dans la résolution d'un problème. Dans une seconde partie, nous abordons les effets de la structure et de la présentation du matériel, sur la charge cognitive et l'apprentissage. Ces travaux ont été conduits depuis la fin des années 80 jusqu'à aujourd'hui. Enfin, dans une troisième partie, nous aborderons les conséquences des résultats obtenus par Sweller sur la conception de situations d'apprentissages, thème qui préoccupe beaucoup Sweller ces dernières années, mais qu'il n'a cessé d'évoquer tout au long de sa carrière.

La théorie de la charge cognitive

La théorie de la charge cognitive est en accord avec les modèles d’architectures classiques du système cognitif, i.e. une architecture composée d’une mémoire de travail (MDT) à capacité limitée dans laquelle ont lieu tous les apprentissages et les pensées conscientes et une mémoire à long terme (MLT) à capacité illimitée, possédant entre autres un nombre important de schémas automatisés. Dans cette théorie, la notion de schéma joue un rôle central, car les schémas permettent d'outrepasser la capacité limitée de la mémoire de travail. Ils permettent de traiter des structures de connaissances complexes et généralisées comme des unités simples de mémoire. Par exemple, nous pouvons traiter comme une seule unité l'infinie variété des graphies manuelles de la lettre a. Un autre aspect important des schémas est qu’ils peuvent opérer aussi bien dans le domaine de l'activité contrôlée (consciente) qu'automatique. Or, la plupart des tâches d'apprentissage requièrent un effort conscient et un temps considérables pour passer d'un traitement d'abord contrôlé à un traitement automatique. Par exemple, le traitement de la lettre a requiert beaucoup plus d'efforts pour l'enfant qui commence à apprendre à lire que pour un adulte sachant bien lire. Autrement dit, la plupart des tâches d’apprentissage visant l’acquisition d’un schéma impliquent une charge cognitive... qui va éventuellement gêner l’apprentissage. Sweller (1988) insiste sur le fait que les processus impliqués dans la résolution de problèmes et ceux impliqués dans l’acquisition de schémas sont substantiellement différents.

L’objectif de Sweller et de ses collaborateurs va donc être (a) d’identifier ce qui augmente la charge cognitive et gêne l’apprentissage (b) de concevoir différentes techniques pour faire baisser la charge cognitive et faciliter l’apprentissage.

Structure du but et théorie des tests d'hypothèses

A la fin des années 70 et au début des années 80, la psychologie cognitive anglo-saxonne est très largement dominée par la théorie dite " du traitement de l'information ", dans la droite lignée du General Problem Solver de Newell et Simon (1972). De façon très rapide et superficielle, disons que, selon cette théorie, le système cognitif humain résout un problème en élaborant une représentation du but à atteindre, puis en élaborant une stratégie " moyens-fins " qui consiste à partir de ce but et à rebrousser progressivement chemin, de sous-buts n en sous-buts n-1, jusqu'à l'état initial du problème. Sweller va conduire des recherches expérimentales visant à montrer les limites de ces théories, et à promouvoir un autre type de théorie, dite " théorie des tests d'hypothèses " (Levine, 1975). Pour Sweller, l'analyse moyens-fins ne convient qu'à un certain type de problème, et il va s'attacher à montrer dans quel type de situation ce modèle ne fonctionne pas. C'est l'analyse des effets de la structure du but du problème qui va permettre à Sweller de délimiter le domaine de validité de la théorie dominante.

Dans l'article de Sweller et Levine (1982), les auteurs utilisent l'argumentation suivante : (1) il n'y a pas forcément apprentissage lors de l'utilisation d'une analyse moyens-fins en situation de résolution de problème de transformation ; (2) le but n'est pas forcément clairement spécifié par le sujet en situation de résolution de problème, d'où le défaut de l'analyse moyens-fins dans ce type de situation ; (3) les sujets peuvent procéder par hypothèses successives sur la structure du but, notamment sur le prochain sous-but. Si le résultat est conforme à ce qui était attendu, alors il suffit de continuer ; si le résultat n'est pas conforme à ce qui était attendu, alors on change ; (4) la spécification dans l’énoncé du but et de la structure du but induit une analyse moyens-fins qui peut gêner l'apprentissage de la structure, de la règle, augmenter le temps de résolution ainsi que le nombre de faux pas.

Dans cet article, cinq expérimentations sont présentées. Les sujets, des étudiants de l’Université de New York, doivent suivre avec le doigt un tracé en creux dans un labyrinthe, du départ jusqu'à l’arrivée (Figure 1). On leur bande les yeux, et on place leur index droit à l'entrée du labyrinthe. Dans la condition " information sur le but ", on place l'index gauche des sujets sur le point d'arrivée, avec interdiction de le déplacer. Dans la condition " pas d'information sur le but ", on interdit simplement aux sujets de l’autre groupe expérimental d'utiliser leur main gauche, et on ne leur donne aucune information sur le but.

On voit dans la figure 1 du labyrinthe que, en condition " information sur le but ", chaque fois qu'en situation de choix le sujet rapproche son index droit de son index gauche (ce qui doit intuitivement être son but) il fait le mauvais choix.

 

Figure 1. Labyrinthe utilisé par Sweller et Levine (1982)

 

Dans l’expérience 2, les auteurs demandent aux sujets de résoudre le problème deux fois de suite. Les résultats obtenus sont rapportés dans le tableau 1. Ils indiquent que le nombre d’erreurs est significativement moins important quand les sujets n’ont pas d’information sur le but que quand ils en ont. Les scores au deuxième essai indiquent qu’il y a un effet d’apprentissage sensiblement plus fort avec le groupe " pas d’information sur le but " qu’avec le groupe " information sur le but ", en tous cas sur la première partie du parcours des sujets dans le labyrinthe lors du problème initial, et lors de la seconde partie lors de la seconde résolution du problème.

Tableau 1. Performances moyennes des sujets au cours de l’expérience 2

Mesures

groupe " information sur le but "

groupe " pas d’information sur le but "

Nb d’erreurs sur le problème initial

7,8

4,5

Nb d’erreur sur la re-résolution sur problème

2

1,2

Proportion d’erreurs sur la seconde partie du parcours dans le problème initial

.50

.33

Proportion d’erreurs sur la première partie du parcours dans la re-résolution du problème

.29

.0

 

Les théories " moyens-fins " de la résolution de problèmes d’induction de règles indiquent que l’induction peut être expliquée par l’existence de deux espaces-problème, l’un étant réservé à la génération de règles, l’autre aux tests d’instances sur lesquelles les règles sont appliquées (Simon & Lea, 1974). Le feed-back procuré par le test influence le générateur de règles. Le but recherché est, dans ce cas, une règle qui s’applique de façon adéquate à toutes les instances, et l’ensemble des règles peut être modifié par une analyse moyens-fins jusqu'à ce que le but soit atteint. Ce type de théorie ne distingue pas les buts qui sont des états du problème et les buts qui sont des moyens alternatifs. Dans les expériences de Sweller et Levine, les groupes de sujets " sans information sur le but " ne reçoivent pas d’information sur le but en tant qu’état du problème. Les problèmes d’induction de règles, comme l’apprentissage d’un concept, ne peuvent normalement pas avoir de but communicable comme un état du problème, et peuvent donc, sur cet aspect, être considérés comme comparables aux problèmes posés aux groupes " sans information sur le but ". Dans les deux cas, les sujets doivent, soit répondre au hasard, soit dériver une règle d’une activité préalable de résolution de problème. Dans les expériences de Sweller et Levine, l’absence de but explicitement stipulé influence (favorablement) la façon dont le problème est résolu, ce qui semble indiquer qu’il faudrait distinguer cette activité de l’analyse moyens-fins. Pour Sweller, ce type de résultat est d’abord une faille dans les théories classiques du traitement de l’information, fondées sur l’analyse " moyens-fins ", au niveau de leur capacité (1) à catégoriser les problèmes (2) à distinguer l’activité de résolution de problème de l’activité d’apprentissage. Ensuite, ce type de résultat est interprété par les auteurs dans le cadre la théorie des tests d’hypothèses. Pour cette théorie, l’activité cognitive est régulée en cours d’histoire, en fonction des événements et de stratégies proactives (à partir du coup n vers le coup n+1).

A un premier niveau, on peut donc dire que chaque théorie correspond à une catégorie de problèmes. Les théories de tests d’hypothèses conviennent bien aux problèmes " stimulus - réponse - feed-back ", d’induction de règle, où la résolution passe par une considération directe du feed-back et où le but devient en quelques sortes de " trouver la règle appropriée qui donnera un feed-back positif ". On peut même jouer sur les dispositifs d’information sur le problème et sur la résolution du problème (information sur le but ou feed-back direct) : cela a un effet sur la résolution du problème et sur ce qui est appris.

A un second niveau, on peut aussi penser que les théories des tests d’hypothèses pourraient remplacer les théories classiques du traitement de l’information, comme modèle général de la résolution de problème. Pourtant, ces théories auront peu de succès, et, assez rapidement, Sweller va renoncer à ce type de cadre pour lui préférer la théorie des schémas : " J’ai trouvé que la théorie des tests d’hypothèses fournissait un bon cadre dans lequel travailler, mais j’ai cessé de l'utiliser, car (1) une grande partie du champ de recherche a cessé de l’utiliser (2) la plupart de ce qui est dit par cette théorie peut être dérivé de la théorie des schémas. Les hypothèses concernent des règles et je doute qu’il soit possible de donner une définition d’une règle qui ne soit pas incluse dans la définition d’un schéma (tous les schémas ne sont pas des règles mais je ne peux pas penser à une règle qui ne reflète pas un schéma) ".

En dehors de cet aspect théorique du travail de Sweller, cet ensemble d’expériences va lui permettre d’isoler un effet sur l’activité de résolution de problème et sur l’apprentissage, l’effet de spécificité du but, qui va orienter ses recherches futures vers des considérations didactiques et pratiques. " L’effet de spécificité du but a été le premier effet " didactique " que nous ayons trouvé. Nous en avons discuté, car nous étions dans une période de transition entre la théorie des tests d’hypothèses et celle des schémas. Ainsi Sweller et Levine (1982) ont utilisé la théorie des tests d’hypothèses tandis que Sweller, Mawer et Ward (1983) utilisaient la théorie des schémas. Nous traitons maintenant de l’effet de spécificité du but comme la première procédure didactique d’un ensemble qui peut être expliqué par la théorie de la charge cognitive ".

Dans la partie suivante, nous allons évoquer un second aspect des travaux de Sweller, qui démarre au milieu des années 80 et qui se poursuit aujourd’hui encore. Ce sont les effets de format de présentation du matériel à traiter en situation d’apprentissage qui vont maintenant intéresser Sweller. Les conséquences " didactiques " de ces recherches sont assez nombreuses. Nous les évoquerons dans la dernière partie de cet article. Les conséquences " théoriques " de ces recherches résident dans l’élaboration de la théorie de la charge cognitive.

Effets de la structure et de la présentation du matériel

Quand un sujet doit traiter un matériel informatif multi-média faisant appel à un mode sensoriel (par exemple un schéma commenté par un texte écrit) ou deux (par exemple un schéma commenté par un texte lu à haute voix), il doit avoir une activité d’intégration mentale des différentes informations, pour comprendre de façon synthétique ce qui lui est présenté de façon séparée. Cette activité d’intégration mentale a un coût cognitif. L’objectif de Sweller va être (1) d’identifier ce qui a un effet sur ce coût (2) de trouver des solutions pour faire baisser ce coût (3) d’interpréter ces effets dans le cadre de la théorie de la charge cognitive. Il va admettre, peut-être un peu tardivement, que cette théorie est compatible avec le modèle de Baddeley de la MDT (Baddeley, 1986) à deux processeurs (le " calepin visuo-spatial " et la " boucle phonologique "), largement indépendants, et coordonnés par un administrateur central. Pour Sweller, ce modèle rend compte de nombreux résultats où, manifestement, les sujets traitent les deux modes de façon indépendante, ou en tous cas, non concurrente.

Sweller va donc consacrer son travail à l’identification de ce qui a un effet sur le coût impliqué par l’activité d’intégration mentale. Le premier effet est appelé " effet de dissociation de l’attention ".

 

L'effet de " dissociation de l’attention "

L'effet de " dissociation de l’attention " se produit quand les sujets doivent traiter des sources d'information multiples dont l'intégration doit être opérée mentalement afin que le sens puisse être inféré du matériel présenté. Par exemple, en géométrie, les sujets doivent dissocier leur attention entre d'une part le traitement de la figure présentée et d'autre part le texte relatif à cette figure. Le matériel présenté ne peut être compris qu'à condition que le sujet intègre mentalement les sources d'information disparates. La théorie de la charge cognitive a été utilisée pour suggérer que le processus de dissociation de l'attention ainsi que celui d'intégration mentale du matériel sont coûteux cognitivement, et ceci à cause des modes traditionnels de présentation et de structuration de l'information. De nombreuses recherches conduites par Sweller dans des disciplines aussi diverses que l'ingénierie électrique, la biologie, la physique, la rédaction de rapports, les mathématiques ou l'informatique ont démontré que l'intégration physique des sources d'information, par exemple en plaçant les commentaires écrits sur les endroits appropriés de la figure géométrique plutôt que de façon adjacente, élimine les effets négatifs de l'attention dissociée. Ce type de résultat a aussi été obtenu par Wickens et ses collaborateurs (Wickens & Andre, 1990 ; Boles & Wickens, 1987 ; Wickens, 1987), qui ont énoncé un principe de " proximité de présentation ".

Une des plus célèbres séries d’expériences qui montrent la diminution de l’effet de dissociation de l’attention par intégration du matériel a été publiée par Sweller, Chandler, Tierney et Cooper (1990). Dans une première phase, les sujets, de classe de 3ème, reçoivent des explications sur le calcul du point médian et de la pente d'une ligne.

 

Figure 2. La configuration " exemple résolu " (Sweller et al. 1990).

 

Figure 3. La configuration modifiée : solution intégrée dans la figure (Sweller et al. 1990).

 

Puis, dans une seconde phase (phase d’acquisition), les expérimentateurs présentent aux sujets quatre exemples de problèmes géométriques, selon trois modalités possibles : (1) configuration classique : question + figure ; (2) exemple résolu : question + figure + solution (figure 2) ; (3) configuration modifiée : question + solution intégrée dans la figure (figure 3).

Les deux premiers problèmes présentés aux sujets sont identiques, avec des valeurs différentes pour les deux exercices et comme solution une valeur positive de la pente ; les deux derniers sont aussi identiques avec des valeurs donnant comme solution une valeur négative de la pente. Le premier groupe de sujets travaille avec les 4 problèmes présentés selon la configuration 1 (les sujets doivent donc trouver la solution par eux-mêmes). Le second groupe de sujets doit travailler avec les problèmes 1 et 3 présentés selon la configuration 2 (avec la solution) et avec les problèmes 2 et 4 présentés selon la configuration 1 (sans la solution). Le troisième groupe de sujets doit travailler avec les problèmes 1 et 3 présentés selon la configuration 3 et avec les problèmes 2 et 4 présentés selon la configuration 1.

Enfin, dans une troisième phase (phase test), tous les sujets devaient résoudre trois nouveaux problèmes présentés de façon classique (configuration 1).

Les résultats indiquent que la configuration " solution intégrée " demande significativement moins de temps de traitement que les deux autres configurations, lors de la phase d’acquisition (tableau 2). Les résultats obtenus dans la phase test (tableau 3) montrent aussi la supériorité significative de la configuration " solution intégrée " quant au temps passé pour résoudre deux des problèmes, et un nombre moindre d’erreurs pour un des problèmes.

 

Tableau 2. Nombre moyen de secondes pour atteindre la solution pendant la phase d’acquisition (Sweller et al. 1990).

 

Groupes

Essais 1 et 3

Essais 2 et 4

configuration classique 

192,8

140,2

exemple résolu : figure + solution

73,3

182,4

configuration modifiée : solution intégrée dans la figure

62,0

157,6

 

Tableau 3. Nombre moyen de secondes pour atteindre la solution et nombre moyen d’erreurs pendant la phase test (Sweller et al. 1990).

Problème 1

Problème 2

Problème 3

s

erreurs

s

erreurs

s

erreurs

configuration classique 

120,9

1,3

114,5

0,8

499,7

3,5

exemple résolu : figure + solution

131,8

0,6

144,1

0,8

465,9

2,8

configuration modifiée : solution intégrée dans la figure

104,1

1,1

82,4

0,3

369,4

2,1

 

L'utilisation d'instructions en mode duel et l’effet du degré d’interactivité

Si l'élimination de l'effet de " dissociation de l’attention " améliore l'apprentissage en baissant la charge de la mémoire de travail, Mousavi, Low et Sweller (1995) suggèrent qu'un même effet positif peut être obtenu en augmentant la taille de la mémoire de travail effective. Ces auteurs suggèrent que, pour atteindre ce type de but, il faut utiliser des présentations didactiques en mode duel, i.e. dans lesquelles les diverses sources d'information qui requièrent d'être intégrées sont présentées selon des modalités sensorielles différentes (auditive et visuelle). Ils ont montré qu'une figure géométrique présentée visuellement et commentée oralement améliore l'apprentissage par rapport à une présentation conventionnelle (figure et texte présentés en mode visuel).

Sweller et ses collaborateurs ont aussi montré que cet effet de présentation en mode duel n’existe que quand le matériel est difficile à traiter, i.e. quand il entraîne un coût cognitif élevé à cause d’un nombre important de points de la figure commentés par un texte. Les auteurs qualifient ce type de situation comme possédant un haut niveau d’interactivité. A l’inverse, dans les configurations à faible degré d’interactivité, il y a peu de points de la figure qui sont commentés.

Par exemple, Tindall-Ford, Chandler & Sweller (1997) font l'hypothèse que le matériel didactique qui utilise des techniques de présentation " duelles " (e.g. texte lu oralement et diagrammes visuels) peut entraîner un meilleur apprentissage que l'équivalent présenté selon un mode simple (e.g. texte écrit et diagrammes visuels). Pour eux, cet effet de la modalité de présentation peut être attribué à une extension de la mémoire de travail effective. Trois expériences sont présentées, utilisant divers matériels didactiques, qui montrent que les sujets qui étudient un matériel incorporant du texte lu et des diagrammes visuels ou des tableaux ont des meilleures performances que ceux qui étudient un matériel conventionnel, i.e. simplement visuel. Ces résultats ont été obtenus seulement dans des situations d’apprentissages avec un contenu à haut degré d’interactivité. Dans l’expérience 3, les expérimentateurs ont travaillé avec deux groupes de 12 apprentis d’une grande entreprise de Sydney. Dans une première phase d’apprentissage d’un cours d’électricité, intégrant des symboles électriques et des circuits électriques, le premier groupe travaille sur un matériel didactique uniquement visuel, tandis que le second groupe travaille sur le même cours présenté de façon audiovisuelle (les textes – i.e. des commentaires verbaux des schémas étudiés, des explications - étaient écrits pour le premier groupe et enregistrés sur magnétophone pour le second groupe). Certains aspects du matériel à apprendre présentent un haut degré d’interactivité (16 points de la figure sont commentés par un texte), tandis que d’autres présentent un faible degré d’interactivité (2 points de la figure sont commentés). Après la phase d’apprentissage, on demande aux sujets (phase 1) d’estimer leur effort intellectuel sur une échelle en sept points de " charge cognitive subjective ", puis on leur présente un ensemble de questions (légender ou dessiner des schémas électriques, répondre à des questions sur le fonctionnement d’un circuit électrique présenté, trouver des erreurs dans un schéma de circuit électrique) en temps limité ; la procédure est répliquée avec les mêmes sujets un mois après (phase 2). Des différences favorable au groupe audiovisuel sont attendues pour les passages à haut degré d’interactivité et non pour les passages à faible degré d’interactivité. Les résultats vont dans le sens des hypothèses, aussi bien en ce qui concerne les aspects à faible interactivité (tableau 3) que les aspects à haute interactivité (tableau 4).

 

Tableau 3. Valeurs maximales, moyennes et écart-types des scores, temps passés et charge cognitive subjective pour les tâches à faible degré d’interactivité (Tindall-Ford et al. 1997)

 

Présentation visuelle

Prés. audiovisuelle

Max.

m

s’

m

s’

Phase 1

Charge cognitive subjective

7 pt

4,2

1,3

3,8

1,3

Temps passé à légender

300 s

146,2

61,9

137,5

50,6

Temps passé à dessiner

300 s

124

46,8

114,8

31,9

Score légende

15 pt

9,3

2,6

8,9

3,5

Score dessin

15 pt

6,8

2

7,8

2,8

Phase 2

Charge cognitive subjective

7 pt

4

1,3

3,7

1,3

Temps passé à légender

300 s

119

29,7

124,8

38

Temps passé à dessiner

300 s

114,8

31,9

122,8

36,8

Score légende

15 pt

11

3,1

10,8

2,5

Score dessin

15 pt

8,4

3

9,9

2,4

 

Les différences en faveur de la présentation audiovisuelle dans les situations à haut degré d’interactivité sont significatives, aussi bien pour ce qui concerne le temps (temps passé à réaliser les schémas, à répondre aux questions) que le nombre de bonnes réponses, et la charge cognitive subjective. Il n’y a pas d’effet sur le nombre d’erreurs trouvées, ni d’effet phase (les performances ne sont pas significativement différentes un mois après). Il y a en revanche, un effet d’interaction entre le score et l’effet phase : les scores sont meilleurs un mois après pour la présentation visuelle alors qu’ils ne le sont pas pour la présentation audiovisuelle.

 

Tableau 4. Scores, temps passés et charge cognitive subjective pour les tâches à haut degré d’interactivité (Tindall-Ford et al. 1997).

Présentation visuelle

Prés. audiovisuelle

Max.

m

s’

m

s’

Phase 1

Charge cognitive subjective

7 pt

5,5

1,1

4,1

1

Temps réalisation du schéma

300 s

251

88,9

183,3

91,2

Nombre de schémas corrects

12

3/12

8/12

Questions tests

5 pt

1,7

1,8

3,5

1,7

Nombre d’erreurs trouvées

4

1,6

0,8

2,6

1,1

Phase 2

Charge cognitive subjective

7 pt

4,8

1

4,5

1

Temps réalisation du schéma

300 s

207,2

90,1

131,1

65,6

Nombre de schémas corrects

12

7/12

11/12

Questions tests

5 pt

1,9

1,9

3,3

2,1

Nombre d’erreurs trouvées

4

2,9

1,3

2,9

1

L’ensemble des résultats de Sweller et ses collaborateurs semble donc indiquer que l’effet de dissociation de l’attention peut être minimisé ou éliminé en intégrant physiquement les informations textuelles et imagées mutuellement référencées, ou en utilisant le canal auditif pour présenter les informations verbales. Cette diminution de l’effet de dissociation ne s’exprime que quand l’effort pour traiter l’intégration est important, i.e. quand il y a de nombreuses informations mutuellement référencées. Ces résultats vont dans le sens de Mayer et ses collaborateurs (Mayer & Anderson, 1991, 1992), qui ont montré, après d’autres, que les présentations audiovisuelles simultanées sont plus efficaces que les présentation audiovisuelles séquentielles. Ceci renforce encore l'idée qu'il faut lutter contre l'effet de dissociation et rechercher l'intégration physique des sources d'information.

Dans ses travaux les plus récents, Sweller va étudier comment se manifestent les effets qu’il a isolé en fonction de l’expertise des sujets. Si l’effet ne s’exprime que quand l’effort cognitif est important, il ne devrait pas s’exprimer avec des sujets experts dans le domaine traité. Il va aussi reprendre une question qui l’avait préoccupé auparavant : celle de l’effet de la redondance de l’information présentée, sur la charge cognitive et sur l’apprentissage. Nous allons traiter ces deux derniers aspects dans la partie suivante.

Expertise des sujets et redondance de l’information présentée

L’effet de l’expertise des sujets sur la charge cognitive est au départ très simple : plus un sujet est expert dans un domaine, moins le traitement d’une situation dans ce domaine va être cognitivement coûteux pour lui. Ceci est généralement expliqué par le fait que l’expertise dans un domaine de connaissance se traduit par l’acquisition de schémas dans ce domaine de connaissance ; comme la mobilisation d’un schéma en MDT ne représente pas plus de coût que la mobilisation d’une information simple, le traitement d’une situation dans un domaine où le sujet est expert va utiliser peu de place en MDT.

Les travaux de Sweller vont montrer (par exemple Kalyuga, Chandler & Sweller, 1998) qu’avec des sujets d’un bon niveau d’expertise dans un domaine donné, l’effet de dissociation de l’attention n’est pas éliminé ni même amoindri par les techniques d’intégration texte-image. En comparant ces sujets avec des sujets novices pour les mêmes tâches dans les deux conditions " matériel classique " et " matériel intégré ", on se rend compte qu’en fait ce n’est pas tant que l’effet de dissociation de l’attention n’est pas éliminé avec les sujets experts en condition " matériel intégré ". C’est plutôt qu’il n’y a pas ou peu, avec ces sujets, d’effet de dissociation de l’attention en condition " matériel classique " (ou en tous cas pas de difficulté à traiter des sources d’information disparates).

L’effet de la redondance du matériel à traiter est aussi assez simple, au premier abord : le matériel redondant, où la même information est présente plusieurs fois sous des formes différentes (par exemple sous forme textuelle et sous forme imagée) entraîne une charge cognitive plus importante (donc des performances moins bonnes) que le même matériel présenté sans redondance (Bobis, Sweller & Cooper, 1993 ; Chandler & Sweller, 1991, 1996 ; Reder & Anderson, 1982 ; Sweller & Chandler, 1994). La différence entre l’effet de dissociation de l’attention et l’effet de la redondance réside dans le fait que l’effet de dissociation de l’attention s’exprime quand les sources d’informations ne sont pas compréhensibles de façon isolées, tandis que l’effet de la redondance s’exprime quand il est possible de comprendre ces informations de façon isolée.

L’expression de ces effets est très directement liée à l’expertise des sujets. Kalyuga, Chandler et Sweller (1998) écrivent explicitement que tout se passe comme si le même matériel considéré comme intégré pour des sujets novices et ayant un effet positif sur leurs performances, pouvait être considéré comme redondant pour des sujets experts, et aurait un effet négatif sur leurs performances. Les auteurs illustrent cela dans les tableaux synthétiques suivants (Figure 4), relatant les résultats principaux de trois expériences, à travers des indicateurs de performance relative (les variables dépendantes sont de même nature que celles utilisées dans l’expérience rapportée dans la partie précédente : questions, détection d’erreurs).

 

Figure 4. Indicateurs de performance relative (les moyennes des performances sont rapportées l’une à l’autre) pour les formats intégrés et classiques en fonction de l’augmentation de l’expertise (Kalyuga et al. 1998).

Les auteurs ont voulu montrer que plus les sujets ont de connaissances (de schémas ?) dans le domaine, moins l’intégration physique des informations est efficace pour eux (plus l’intégration a des effets comparables à ceux de la redondance).

 

Conséquences des résultats sur la conception de situations d'apprentissage

 

Les recherches de Sweller ont des conséquences didactiques très concrètes, qui sont résumées dans l’article de Sweller, van Merrienboer & Paas (sous presse). Dans cette dernière partie, nous en faisons une présentation succincte.

  • Ne pas spécifier le but

    Quand on spécifie le but d’un problème à un sujet qui ne possède pas le schéma pour résoudre ce problème immédiatement, on induit chez lui une démarche d’analyse moyens-fins qui peut être extrêmement coûteuse cognitivement et se solder par une absence d’apprentissage. En effet, avec ce type de stratégie de résolution de problème, le sujet doit maintenir de façon constante en MDT, à la fois le but, l’état du problème, les relations entre eux, les opérateurs qui peuvent réduire la différence entre eux, et les sous-buts. En revanche, les problèmes sans but spécifié ne requièrent que le maintien en MDT de chaque état du problème et des opérateurs qui peuvent s’y appliquer.

    L’efficacité didactique des problèmes sans but spécifié, comparée à celle des problèmes à but spécifié a été illustrée dans de nombreuses expériences en géométrie, en cinématique, en trigonométrie et en biologie par au moins trois équipes différentes.

  • Travailler sur des exemples de problèmes résolus

    Toute chose étant égale par ailleurs, travailler sur des exemples de problèmes résolus entraîne un meilleur apprentissage que travailler sur des exemples de problèmes non-résolus. Cet effet de présentation de la solution du problème est contre-intituitif, mais très robuste. Il est particulièrement efficace quand les aspects pertinents du problème étudié et ce qu'ils sont censés illustrer sont soulignés (Anderson, Boyle, Corbett & Lewis, 1990). L'effet des exemples de problème résolus s'explique par une baisse de la charge cognitive, un focus de l'attention sur les états du problème et sur les opérateurs associés, ce qui permet l'induction de solutions générales ou de schémas.

    Cet effet a été mis en évidence en algèbre par Sweller et Cooper (1985, Cooper & Sweller, 1987), mais aussi en statistiques, en géométrie et en programmation informatique (LISP), dans une dizaine de recherches conduites par des équipes différentes. Zhu et Simon (1987) ont même réussi à faire apprendre un cours de mathématiques en 2 ans, alors qu'il durait habituellement 3 ans, en remplaçant certains aspects de l'enseignement classique en classe par l'étude d'exemples de problèmes résolus.

    Il faut cependant noter que l'usage exclusif de problèmes résolus n'est pas une bonne solution. Cela peut en effet inhiber, chez le sujet, la génération de solutions nouvelles et créatives ; il semble donc tout à fait opportun de proposer aux élèves des exercices complémentaires, notamment des problèmes partiellement résolus (ce dernier aspect a été mis en évidence par Paas (1992) et non pas par Sweller). Il faut aussi signaler que la conception de bons exemples de problèmes résolus est difficile.

  • Intégrer les informations pour éliminer l'effet de dissociation de l'attention

    L'effet de dissociation de l'attention sur des sources d'informations disparates s'exprime particulièrement lors du travail sur des exemples de problèmes résolus. Une façon d'éliminer l'effet de dissociation de l'attention consiste à intégrer physiquement (à présenter à proximité) les informations textuelles et les informations imagées mutuellement référencées. Autrement dit, les effets des exemples de problèmes résolus et d'intégration des informations sont liés, l'étude d'exemples de problèmes résolus présentés de façon intégrée étant plus efficace que le travail sur des problèmes non-résolus présentés de façon conventionnelle.

    Sweller souligne souvent que l’élimination de l’effet de dissociation ne peut avoir lieu que quand il y a, au départ, un grand besoin d’attention, c’est-à-dire une situation difficile à traiter : beaucoup d’éléments d’information mutuellement référencés et/ou un faible niveau de connaissance dans le domaine traité.

  • Utiliser deux modalités sensorielles plutôt qu’une

    La charge en MDT est moins importante quand le même matériel est présenté en utilisant les canaux auditifs et visuels, que quand on utilise le seul canal visuel. La phase d’étude de configurations " matériel verbal / matériel imagé " mutuellement référencés est plus efficace quand le matériel verbal est présenté oralement que quand il est présenté par écrit. Ce résultat a été répliqué en géométrie et en électricité par Sweller et son équipe. Il est appuyé par la revue de la littérature psychologique expérimentale conduite par Penney (1989) qui montre que la capacité effective de la MDT est augmentée quand les modes visuels et auditifs sont mobilisés, et par le modèle de Baddeley (1986) d’une MDT à deux processeurs.

  • Ne pas présenter d’information redondante

    Quand deux informations redondantes sont présentées à un sujet, la charge cognitive est plus importante que quand une seule de ces informations est présentée. Ce résultat a été répliqué par Sweller et ses collaborateurs avec des problèmes d’électricité, de géométrie, etc. L’effet de la redondance est un problème assez ancien en psychologie, il précède les travaux sur la charge cognitive, et il a occupé de nombreuse équipes dans des domaines assez différents (mémoire, perception, apprentissage… sur des matériels textuels, imagés et sonores). Le problème posé par l’étude de cet effet réside dans la définition de la redondance, qui, selon toute vraisemblance ne peut pas être considérée seulement de façon intrinsèque à la situation, mais dépend largement du niveau d’expertise du sujet dans le domaine de la situation traitée (cf. plus haut, le chapitre consacré à cet effet). Selon Sweller, les difficultés rencontrées par les chercheurs en psychologie avec la notion de redondance depuis des dizaines d’années vient (1) du fait que l’effet de redondance est contre-intuitif (2) qu’aucun cadre théorique clair ne vient préciser le sens de cette notion.

    C’est selon Sweller sur ce dernier point que la théorie de la charge cognitive peut remplir un rôle que les autres théories psychologiques n’ont pas su remplir.

    Conclusion

    A ce jour, Sweller a conduit environ 200 expériences, utilisant des situations d’apprentissage variées dans des disciplines différentes, en laboratoire comme en situation réelle. Ces résultats ont à la fois abouti à des techniques didactiques très concrètes et à une théorie, celle de la charge cognitive. On peut aussi souligner que ses travaux ont contribué à faire mieux comprendre les relations entre apprentissage et résolution de problèmes.

    Les travaux de Sweller sont souvent cités en Europe et aux Etats-Unis. L’idée de présenter ses travaux dans une revue Française vient de l’intuition qu’en France ils sont peu connus, bien que quelques recherches récentes y soient tout à fait " swelleriennes ". Par exemple, les travaux de Ganier, Gombert et Fayol (1998), sur l’intégration d’informations textuelles et imagées dans la conception de modes d’emplois répliquent très justement les résultats de Sweller. Les expériences de Bétrancourt (1996 ; Bétrancourt & Caro, 1998) montrent que l’intégration d’informations sous la forme de fenêtres de texte escamotables (sur écran d’ordinateur) est parfois encore plus efficace que l’intégration " figée ". D’autres recherches comme celles de Lieury et ses collaborateurs (notamment Lieury, Badoul & Belzic, 1996), partant du même type de question sur l’efficacité relative de divers formats de présentation sur l’apprentissage, aboutissent à des résultats partiellement contradictoires en ce qui concerne l’utilisation de deux modalités plutôt qu’une, mais avec des tâches très différentes. Il serait peut-être intéressant de vérifier si les contradictions perdurent avec des tâches comparables avec celles de Sweller. Enfin, peut être que l’envie de présenter les travaux de Sweller vient tout simplement que notre intérêt personnel pour la théorie de la charge cognitive. Nous avons souligné ailleurs (Tricot & Chanquoy, 1996) que si les résultats des expériences de Sweller ont beaucoup apporté au domaine de la psychologie des apprentissages et de la didactique, le rôle des connaissances antérieures du sujet sur la charge cognitive n’est pas encore très clairement décrit dans la théorie. Les difficultés tiennent selon nous à la fois au modèle de MDT " à la Baddeley " qui n’intègre pas clairement les spécificités des connaissances antérieures (contrairement par exemple à Ericsson & Kintsch, 1995), et à certains aspects de la théorie, comme les notions de redondance et d’information, qui sont empruntés de façon très intuitive et sans réelle définition à la théorie mathématique de l’information.

    Remerciements

    Je tiens à remercier très vivement John Sweller pour son aide dans l’écriture de cet article : il a non seulement fourni la matière première de cette article, mais m’a aussi aidé à lui donner une forme, et a éclairé de points de vue jamais publiés le sens général de son travail. Je remercie aussi Eric Jamet, Jean-Baptiste Lagrange, Mireille Bétrancourt et un lecteur anonyme de la revue pour leurs commentaires sur une version précédente de l’article.

    Références bibliographiques

    Anderson, J.R., Boyle, C.F., Corbett, A.T., & Lewis, M.W. (1990). Cognitive modeling and intelligent tutoring. Artificial Intelligence, 42, 7-49

    Baddeley, A. (1986). Working memory. Oxford : Oxford University Press..

    Bétrancourt, M., (1996). Facteurs spatiaux et temporels dans le traitement cognitif des complexes texte-figure. Thèse en Sciences Cognitives, Institut National Polytechnique de Grenoble.

    Bétrancourt, M., & Caro, S. (1998). Intégrer des informations en escamots dans les textes techniques : quels effets sur les processus cognitifs ? In A. Tricot & J.-F. Rouet (Eds.), Les hypermédias, approches cognitives et ergonomiques. Hypertextes et Hypermédias, numéro hors série.

    Bobis, J., Sweller, J. & Cooper, M. (1993). Cognitive load effects in a primary school geometry task. Learning and instruction, 3, 1-21.

    Boles, D.B., & Wickens, C.D. (1987. Display formatting in information integration and non integration tasks. Human Factors, 29, 395-406.

    Chandler, P. & Sweller, J. (1991). Cognitive load theory and the format of instruction. Cognition and Instruction, 8, 293-332.

    Chandler, P. & Sweller, J. (1996). Cognitive load while learning to use a computer program. Applied Cognitive Psychology, 10, 151-170.

    Cooper, G. & Sweller, J. (1987). The effects of schema acquisition and rule automation on mathematical problem solving transfer. Journal of Educational Psychology, 79, 347-362.

    Ericsson, K.A. & Kintsch, W. (1995). Long-term working memory. Psychological Review, 102 (2), 211-245.

    Ganier, F., Gombert, J.-E. & Fayol, M. (1998). Traitement cognitif d'instructions procédurales et charge mentale induite. Journée d’étude " Traitement Cognitif des Systèmes d'Information Complexes ", Grenoble, 26 juin .

    Kalyuga, S., Chandler, P. & Sweller, J. (1998). Levels of expertise and instructional design. Human Factors, 40, 1-17.

    Levine, M. (1975). A cognitive theory of learning : Research on hypothesis texting. Hillsdale : Lawrence Erlbaum.

    Lieury, A., Badoul, D. & Belzic, A.-L. (1996). Les sept portes de la mémoire. Revue de Psychologie de l’Education, 1.

    Mayer, R.E. & Anderson, R.B. (1991). Animations need narrations : An experimental test of dual-coding hypothesis. Journal of Educational Psychology, 83, 484-490.

    Mayer, R.E. & Anderson, R.B. (1992). The instructive animation : Helping students build connections between words and pictures in multimedia learning. Journal of Educational Psychology, 84, 444-452.

    Mousavi, S., Low, R. & Sweller, J. (1995). Reducing cognitive load by mixing auditory and visual presentation modes. Journal of Educational Psychology, 87, 319-334.

    Newell, A. & Simon, H.A. (1972). Human problem solving. Englewood Cliffs, NJ : Prentice Hall.

    Paas, F. (1992). Training strategies for attaining transfer of problem-solving skill in statistics : a cognitive-load approach. Journal of Educational Psychology, 84 (4), 429-434.

    Penney, C. (1989). Modality effects and the structure of short-term verbal memory. Memory and Cognition, 17, 398-422.

    Reder, L., & Anderson, J. (1982). Effects of spacing and embellishment on memory for main points of a text. Memory and Cognition, 10, 97-102.

    Simon, H.A. & Lea, G. (1974). Problem solving and rule induction : A unified view. In L.W. Greegg (Ed.), Knowledge and cognition. Potomac, Md : Lawrence Erlbaum.

    Sweller, J. (1988). Cognitive load during problem solving: Effects on learning. Cognitive Science, 12, 257-285.

    Sweller, J. & Chandler, P. (1994). Why some material is difficult to learn. Cognition and Instruction, 12, 185-233.

    Sweller, J., Chandler, P., Tierney, P. & Cooper, M. (1990). Cognitive load as a factor in the structuring of technical material. Journal of Experimental Psychology: General,119, 176-192.

    Sweller, J. & Cooper, G. (1985). The use of worked examples as a substitute for problem solving in learning algebra. Cognition and Instruction, 2, 59-89.

    Sweller, J. & Levine, M. (1982). Effects of goal specificity on means-ends analysis and learning. Journal of Experimental Psychology: Learning, Memory and Cognition, 8, 463-474.

    Sweller, J., Mawer, R. & Ward, R. (1983). Development of expertise in mathematical problem solving. Journal of Experimental Psychology: General,112, 639-661.

    Sweller, J., van Merrienboer, J. & Paas, F. (sous presse). Cognitive architecture and instructional design. Educational Psychology Review.

    Tindall-Ford, S., Chandler, P. & Sweller, J. (1997). When two sensory modes are better than one. Journal of Experimental Psychology: Applied, 3, 257-287.

    Tricot, A., & Chanquoy, L. (1996). La charge mentale, "vertu dormitive" ou concept opérationnel? Introduction. In A. Tricot & L. Chanquoy (Eds.), La charge mentale. Psychologie Française, 41 (4), 313-318.

    Wickens, C.D. (1987). Attention. In P. Hancock (Ed.), Human factors in psychology. Amsterdam : Noth Holland.

    Wickens, C.D. & Andre, A.D. (1990). Proximity compatibility and information display : effects of color, space, and onjectness on information integration. Human Factors, 32, 61-77.

    Zhu, X. & Simon, H.A. (1987). Learning mathematics from examples and by doing. Cognition and Instruction, 4, 137-166.

     

    Liste des publications de Sweller dans des revues à referees, autres que celles citées en bibliographie

    Relation between perseveration and position responding in reversal learning. Psychological Reports, 1971, 29, 375-378. (avec A. H. Winefield)

    A test between the selective attention and stimulus generalisation interpretations of the easy-to-hard effect. Quarterly Journal of Experimental Psychology, 1972, 24, 352-355.

    The effect of task difficulty and criteria of learning on a subsequent reversal. Quarterly Journal of Experimental Psychology, 1973, 25, 223-228.

    Effect of amount of initial training on concept shift problems. Journal of Experimental Psychology, 1973, 99, 134-136.

    The effect of task complexity and sequence on rule learning and problem solving. British Journal of Psychology, 1976, 67, 553-558.

    Asymmetrical transfer using a verbal learning paradigm. Australian Journal of Psychology, 1976, 28, 91-96.

    Criterion of learning and task difficulty as determinants of mediated-shift learning speed. Psychological Reports, 1976, 39, 875-879.

    List length and speed of paired associate learning. Psychological Reports, 1976, 39, 858.

    Einstellung, the sequence effect and Hypothesis Theory. Journal of Experimental Psychology: Human Learning and Memory, 1978, 4, 513-526. (avec W. Gee)

    Hypothesis salience, task difficulty and sequential effects on problem solving. American Journal of Psychology, 1980, 93, 135-145.

    Transfer effects in a problem solving context. Quarterly Journal of Experimental Psychology, 1980, 32, 233-239.

    The consequences of history-cued and means-ends strategies in problems solving. American Journal of Psychology, 1982, 95, 455-484. (avec R. Mawer et W. Howe)

    The effects of subgoal density and location on learning during problem solving. Journal of Experimental Psychology: Learning, Memory and Cognition, 1982, 8, 252-259. (avec R. Mawer)

    Control mechanisms in problem solving. Memory and Cognition, 1983, 11, 32-40.

    What do students learn while solving mathematics problems? Journal of Educational Psychology, 1985, 77, 272-284. (avec E. Owen)

    Guidance during mathematical problem solving. Journal of Educational Psychology, 1988, 80, 424-436. (avec R. Tarmizi)

    Secondary school students' representations of solids. Journal for Research in Mathematics Education, 1989, 20, 202-212. (avec M. Cooper)

    Should problem solving be used as a learning device in mathematics? Journal for Research in Mathematics Education, 1989, 20, 322-328. (avec E. Owe)

    Cognitive technology: Some procedures for facilitating learning and problem solving in mathematics and science. Journal of Educational Psychology, 1989, 81, 457-466.

    Structuring effective worked examples. Cognition and Instruction, 1990, 7, 1-39. (avec M. Ward)

    Cognitive processes and instructional procedures. Australian Journal of Education, 1990, 34, 125-130.

    Locus of difficulty in multi-stage mathematics problems. American Journal of Psychology, 1990, 103, 167-193. (avec P. Ayres)

    On the limited evidence for the effectiveness of teaching general problem solving strategies. Journal for Research in Mathematics Education, 1990, 21, 411

    Evidence for cognitive load theory. Cognition and Instruction, 1991, 8, 351-362. (avec P. Chandler)

    The effects of technical instructions on cognitive load. Instructional Science, 1991, 20, 443-462. (avec K. Purnell et R. Solman)

    The split-attention effect as a factor in the design of instruction. British Journal of Educational Psychology, 1992, 62, 233-246. (avec P. Chandler)

    Some cognitive factors relevant to mathematics instruction. Mathematics Education Research Journal, 1992, 4, 83-94. (avec R. Low)

    Some cognitive processes and their consequences for the organisation and presentation of information. Australian Journal of Psychology, 1993, 45, 1-8.

    Demands imposed on primary school children by geometric models. Contemporary Educational Psychology, 1994, 19, 108-117. (avec J. Bobis et M. Cooper)

    Cognitive load theory, learning difficulty and instructional design. Learning and Instruction, 1994, 4, 295-312.

    Understanding instructions. Journal of Educational Psychology, 1996, 88, 49-63. (avec N. Marcus et M. Cooper)

    Some conditions under which integrated computer-based training software can facilitate learning. Journal of Educational Computing Research, 1996, 15, 345-367 (avec P. Chandler et N. Cerpa)

    The role of visual indicators in dual sensory mode instruction. Educational Psychology, 1997, 17, 329-343. (avec H.-J. Jeung et P. Chandler)

    Learning from equations or words. Instructional Science, 1997, 25, 37-70. (avec M. Leung et R. Low)

    Cognitive load and learner expertise: Split-attention and redundancy effects in reading with explanatory notes. Contemporary Educational Psychology, 1998, 23, 1-21. (avec A. Seeshing Yeung et P. Jin)

    Learning to solve compare word problems: The effect of example format and generating self-explanations. Cognition and Instruction, in press. (avec W. Mwangi)

    Managing split-attention and redundancy in multimedia instruction. Applied Cognitive Psychology, in press. (avec S. Kalyuga et P. Chandler)

    .