1

Rouet, J.-F., & Tricot, A. (1998). Chercher de l'information dans un hypertexte : vers un modèle des processus cognitifs. Hypertextes et Hypermédias, n° hors série, 57-74.

Chercher de l'information dans un hypertexte : vers un modèle des processus cognitifs

Introduction

De nombreuses activités humaines (conception, prise de décision, résolution de problèmes) reposent à la fois sur le traitement d'informations complexes (textes, tableaux numériques, données graphiques) et sur la construction de structures de buts hiérarchisées. L'étude de ces activités " hybrides " s'est progressivement développée ces dernières années, l'accent étant mis sur les interactions entre traitement des informations de l'environnement et planification de l'action (au sens de Hoc [HOC 87]). Parmi les nombreux domaines concernés on peut citer la résolution de problèmes arithmétiques [KIN 85], le raisonnement historique [WIN 91], la conduite de processus industriel [SAM 96], la conception architecturale [VRI 94], ou encore la conception de logiciel [ROU 95]. Un dénominateur commun à tous ces domaines est l'obligation constante dans laquelle se trouve le sujet d'obtenir dans son environnement les informations nécessaires à l'accomplissement de la tâche, en écartant les informations non pertinentes. Cet aspect des activités complexes, que l'on peut qualifier globalement de " recherche d'informations ", n'a fait l'objet jusqu'à présent que de peu de travaux spécifiques.

Dans cet article nous nous proposons une réflexion générale sur les mécanismes cognitifs à l’œuvre dans la recherche d'informations (RI) dans les documents complexes. Cette réflexion prolonge nos travaux antérieurs qui visaient à définir un cadre pour l'étude des activités de RI [ROU 95, TRI 95]. Notre objectif principal est de mettre en évidence deux caractéristiques de la RI : d'une part, sa nature cyclique, dynamique et opportuniste ; d'autre part, le caractère hiérarchisé de cette activité, qui met en œuvre des mécanismes d'exécution et de gestion distincts les uns des autres. Pour cela nous adoptons une approche généraliste, qui recherche les points communs à la RI dans différents domaines de tâches, au détriment des aspects particuliers à telle ou telle tâche. Dans une première partie nous rappelons quelques notions psychologiques de base sur lesquelles repose notre approche. Puis nous décrivons les mécanismes d'évaluation, de sélection et de traitement qui forment les " matériaux " de l'activité de RI. Enfin nous montrons comment ces processus sont gérés, c'est à dire planifiés, contrôlés et régulés au moment de leur mise en œuvre.

Nous n'aborderons pas dans cet article les problèmes spécifiques du multimédia, notamment les effets cognitifs de l'intégration d'informations verbales, graphiques ou autres. Nous supposons que les processus de RI sont en partie indépendants de la nature des informations considérées. Par ailleurs, nous nous centrons sur des domaines de RI relativement élémentaires, comme la recherche d'informations ponctuelles dans une encyclopédie. Nous n'examinerons pas l'utilisation de systèmes d'informations dans le cadre d'activités plus complexes. Malgré ces limitations, nous pensons qu'une approche généraliste des activités de RI ouvre des perspectives d'applications intéressantes, notamment en matière de conception ergonomique de systèmes hypermédias. Nous proposerons quelques-unes de ces perspectives dans la conclusion.

Les bases cognitives de la recherche d'informations : mémoire, compréhension et résolution de problèmes

Nous donnons à l'expression " recherche d'informations " un sens psychologique assez éloigné de celui que lui donnent habituellement les informaticiens. Il s'agit pour nous non pas de décrire les propriétés d'algorithmes ou de programmes, mais d'élucider l'ensemble des représentations et des processus cognitifs effectivement mis en œuvre par un humain pour mener à bien une activité de RI dans le contexte d'une certaine tâche. Cette définition est proche de la notion d'information seeking proposée par Marchionini [MAR 95]. Les procédures qui peuvent être identifiées selon cette approche ne sont pas nécessairement les plus rapides ou les plus performantes ; elles sont en revanche les plus plausibles psychologiquement.

Du point de vue humain, la recherche d'informations (RI) présente selon nous trois caractéristiques essentielles : il s'agit d'abord d'une activité complexe, qui fait largement appel aux connaissances individuelles et donc à la mémoire (mémoire à long terme, mémoire de travail) ; ensuite, cette activité passe par le traitement d'informations (le plus souvent textuelles), et fait donc appel à la compréhension ; enfin la RI implique l’exécution d’un certain nombre d’actions successives visant à transformer la situation de son état initial vers le but, et s'apparente donc à la résolution de problèmes. Sur ces trois points les travaux menés en psychologie cognitive ont abouti à des théories générales qui servent d'arrière-plan à notre modèle de la RI.

La compréhension de textes en tant qu'activité cognitive a fait l'objet, entre autres, de la théorie mise au point par Kintsch et ses collègues [KIN 78, DIJ 83, KIN 88]. Selon cette théorie comprendre c'est élaborer une représentation cognitive de la situation évoquée par le texte. Cette élaboration passe par le codage, la condensation et l'intégration du contenu textuel aux connaissances antérieures. Le résultat des processus de codage, de condensation et d'intégration aux connaissances initiales aboutit à une représentation cohérente de la situation évoquée par le texte, ou modèle de situation. Le modèle de situation, bien que basé sur la structure linguistique des informations, n'en a pas toutes les propriétés ; par exemple, certains référents éloignés dans le texte peuvent être " proches " dans le modèle de situation s'ils sont spatialement ou fonctionnellement reliés ; dans ce cas l'activation ultérieure d'un référent entraînera l'activation du référent associé [GLE 87, MOR 87]. Si le codage est largement automatisé chez le lecteur adulte, la condensation et l'intégration peuvent être modulés par les contraintes situationnelles, et notamment par les objectifs de l'activité. On parle alors de gestion métacognitive de la lecture [BAK 84].

Le modèle ACT* [AND 83] concerne les activités de résolution de problèmes et d’apprentissage. Comme dans le modèle de compréhension de Kintsch, la MDT y est considérée comme une sorte d’interface à capacité limitée entre la MLT et la situation à traiter. Son rôle est d’encoder les données de la situation, puis de traiter ces données et les connaissances mobilisées en MLT, pour ensuite commander l’action sur la situation en question. Dans ce modèle, la MLT est divisée en deux : la mémoire déclarative stocke des informations (en réseau) factuelles ou conceptuelles, sous diverses formes (verbales ou imagées). La mémoire procédurale stocke des procédures sous forme de règles de production. Ces procédures sont appliquées aux contenus de la MDT et cette application peut engendrer de nouvelles connaissances déclaratives, créer de nouvelles règles de production ou modifier d'anciennes règles antérieurement stockées.

Tout comme la résolution de problème, la recherche d'informations demande la construction de buts et de méthodes pour atteindre ces buts. Comme la compréhension de texte, la RI demande la construction progressive d'une représentation de contenu. La construction du but et son maintien lors du traitement d'informations demandent de nombreuses opérations en mémoire de travail. L'objectif d'un modèle cognitif de la RI est de rendre compte de ces opérations.

Processus élémentaires de recherche d'informations : Évaluation, Sélection et Traitement

Dans un article antérieur nous avons proposé de distinguer la tâche et l'activité de recherche d'informations [ROU 95]. Un modèle de tâche décrit les composants de la situation de recherche d'informations : buts, moyens et environnement. Un modèle d'activité décrit la mise en œuvre dynamique de ces composants (déroulement dans le temps et interactions). A partir de modèles antérieurs [ARM 93, GUT 88] nous avons distingué trois processus de base de la RI : l'évaluation, la sélection et le traitement. Ces processus constituent en quelque sorte les " modules " de base de la RI, qui peuvent être décomposés en processus plus élémentaires. L'exécution des modules se déroule de façon séquentielle, chaque module passant un certain nombre de paramètres au module suivant.

Évaluation

Définitions

Il peut sembler paradoxal de faire de l'évaluation la première étape de la RI. Mais si l'on conçoit la recherche d'informations comme une activité de résolution de problèmes alors il faut admettre, suivant [HOC 87] que l'individu commence par construire une représentation de la tâche, sans disposer immédiatement des moyens de la réaliser (p. 129). Dans notre perspective, la RI se caractérise entre autres par le fait que les " moyens " en question sont des informations documentaires (textes, graphiques, données numériques) que le sujet doit se procurer dans son environnement (ou système d’information, par exemple, un hypertexte). Evaluer revient à identifier les informations qui manquent pour pouvoir effectuer la tâche (ou cibles). Plus précisément, l'évaluation comporte :

(a) La construction d'une représentation de but : identification des informations requises par la tâche. Ces informations peuvent être très précises (par ex., " Quelle est la date de l'invasion de l'Angleterre par les Normands ? ") ou plus floues (" Quelles sont les causes du déclin de l'empire romain ? ").
(b) La comparaison des informations immédiatement disponibles (dans l'environnement perceptif ou par recherche en mémoire) avec la représentation du but. Plus concrètement le sujet doit déterminer s'il faut ou non engager une recherche dans l'environnement.
(c) La production de critères qui " guident " la recherche proprement dite. Ces critères sont de deux types : critères déclaratifs, qui caractérisent l'information à chercher (voir les exemples ci-dessus) ; critères procéduraux, qui caractérisent la procédure à suivre pour opérer la sélection des catégories d'informations ; les critères procéduraux reposent sur la connaissance de l'environnement (interface-utilisateur) et des circonstances de l'activité (temps disponible, niveau d'exigence de la tâche etc.). Dans le cas d'une question complexe (2e exemple ci-dessus), la procédure de recherche variera de façon importante selon que l'environnement de recherche est un simple dictionnaire, une encyclopédie ou une bibliothèque universitaire ; et selon que celui qui recherche de l’information dispose de quelques minutes, quelques heures ou quelques mois pour effectuer la tâche.

Facteurs influençant le processus d'évaluation

Le processus d'évaluation se prolonge au delà de la phase initiale de la RI. Il intervient également durant les phases de sélection et de traitement des informations. A la fin de chaque cycle de sélection-traitement, le sujet doit évaluer en quoi l’information acquise au cours du cycle correspond à la représentation initiale du but. Très grossièrement trois cas de figure sont possibles :

l’information trouvée correspond exactement au but visé : la recherche peut cesser. Il faut noter que l'arrêt de la recherche n'est pas automatique. Il se peut en effet que la représentation de but soit trop indéterminée, ou qu'elle ait évolué au cours même du traitement des informations, de sorte que le sujet n'évalue pas correctement l'état actuel de ses connaissances [TRI 97].
l’information trouvée ne correspond que partiellement au but : un nouveau cycle de recherche doit commencer à partir d'une évaluation de l'écart entre état actuel et but visé. Cette évaluation pourra aboutir à une modification relative des critères de recherche, par exemple " préciser ", " compléter ", " généraliser " l'information acquise au cours du ou des cycles précédents. Comme dans le cas précédent ceci suppose que la représentation de but soit stable en mémoire. La correspondance partielle entre informations cherchées et informations trouvées peut notamment entraîner une légère modification de la structure de but qui conduit le sujet à croire qu'il a terminé la recherche (biais de confirmation).
l’information trouvée ne correspond pas du tout au but : un nouveau cycle doit commencer à partir d'une réévaluation de la tâche. Il pourra en résulter la définition de nouveaux critères de recherche. Cette situation peut aussi déboucher sur une modification de la représentation de but elle-même.

Le processus d'évaluation diffère selon que la représentation de la tâche s’exprime plutôt en termes de but (l'utilisateur se représente le contenu de ce qu’il cherche, selon des critères déclaratifs) ou en termes de moyens (l’utilisateur se représente comment il doit conduire sa recherche, selon des critères procédraux). En effet, une représentation axée sur le but (i.e. sur le contenu) va pouvoir conduire à un jugement fin sur la pertinence du contenu sélectionné sans forcément être capable d’anticiper à long terme sur la pertinence d’une stratégie. A l’inverse, une représentation axée sur les moyens (i.e. sur la procédure utilisée) va permettre d’anticiper à long terme sur la pertinence d’une stratégie sans forcément être capable d’un jugement fin sur le contenu. Ce type de représentation (en termes de but-contenu ou en termes de moyens-procédure) dépend généralement du degré d’expertise du sujet dans le domaine traité (pour ce qui concerne le but) et dans l’utilisation de ce type de système d’information (pour ce qui concerne les moyens). Gray [GRA 90], par exemple, a montré qu’une représentation peu élaborée en termes de moyens peut entraîner un phénomène de " poursuite sur la même route " très inefficace ou très coûteux.

Une caractéristique particulière du processus d’évaluation, est qu'il doit à la fois maintenir une structure de but cohérente et la faire évoluer en fonction des résultats intermédiaires de la recherche. Cette caractéristique peut avoir des conséquences négatives, car, comme on a pu le montrer dès l’utilisation des premiers hypertextes, elle entraîne la désorientation de l’utilisateur (phénomène de noyade en digressions [FOS 88]). L’utilisateur peut, au bout d’un certain temps de consultation, " oublier " son but initial. Du point de vue cognitif, cette difficulté s'explique par la capacité limitée de la mémoire de travail (MDT). Le chercheur d'informations doit maintenir simultanément (a) le but initial (b) les critères de recherche (c) l'information acquise au cours de cycles précédents. Si, pour une raison ou une autre, la sélection ou le traitement entraînent une surcharge cognitive, alors la représentation du but va être momentanément désactivée. Rouet a montré [ROU 90] que le regroupement de textes et de menus sur l'écran a tendance à désorienter des utilisateurs inexpérimentés : la trop grande quantité d'informations disponibles simultanément entraîne l'oubli des informations précédemment lues, et certains utilisateurs " tournent en rond " dans l'hypertexte. Ce résultat tient en partie au niveau général de lecture de la population étudiée, en l'occurrence des élèves de 12 à 14 ans. Il n'est pas exclu que chez des utilisateurs plus expérimentés le regroupement des textes et des menus soit au contraire un élément facilitateur. Il est aussi très probable [ERI 95] que cette déformation de la représentation du but soit considérablement amoindrie, voire absente, quand le sujet est expert du domaine (à la fois du contenu traité et de l’utilisation de ce type de système d’information). Par ailleurs le fait que la représentation du but puisse évoluer a aussi des conséquences positives : dans les activités à but flou, la modification de la représentation du but peut consister à spécifier celle-ci.

Sélection des catégories d'informations

Définitions

Notons pour commencer que quel que soit l'environnement considéré l'accès à l'information requiert une opération de sélection. Dans une bibliothèque classique l'utilisateur sélectionne un ou plusieurs ouvrages à partir de catalogues ou directement, sur les rayons ; dans beaucoup d'ouvrages à caractère technique ou didactique (encyclopédies, manuels) la lecture est également sélective : elle passe par l'utilisation d'outils tels que table des matières ou index. Dans les systèmes d'informations électroniques la sélection des informations souhaitées se fait le plus souvent par l'intermédiaire de listes d'items ou menus. Les menus sont dits explicites lorsqu'ils sont présentés séparément, et enchâssés lorsqu'ils sont intégrés à un texte [KOV 86]. Les menus sont en général constitués de mots ou expressions thématiques qui renvoient à une catégorie d'information. Ces catégories peuvent être sémantiques (par ex., " peinture du XVIème siècle ") ou correspondre à des actions (par ex., " retour en arrière ").

En première analyse, la sélection peut être définie comme la décision d'examiner une catégorie d'informations par opposition à toutes les autres catégories disponibles. Toutefois il est plus heuristique d'envisager la sélection comme le processus qui conduit à cette décision. Ce processus prend comme entrée l'ensemble de critères déclaratifs et procéduraux issus du processus d’évaluation. Sélectionner revient alors à calculer une valeur d'intérêt (ou si l'on veut, d'importance) pour chaque catégorie d'informations. Selon les cas, le processus de sélection peut être exhaustif ou auto-terminatif : exhaustif lorsque toutes les catégories d'information sont examinées avant qu'une décision soit prise. Auto-terminatif lorsqu'une décision est prise dès lors qu'une catégorie dépasse une certaine valeur-seuil d'intérêt.

Il est important de noter que les sélections opérées dans le cadre d'une RI ne sont pas indépendantes les unes des autres. Chaque sélection utilise en effet les résultats des précédentes, ce qui peut représenter une masse considérable de paramètres : d'une part, la position de l'utilisateur dans le système (qui dépend du chemin parcouru, donc des sélections antérieures) ; d'autre part, l'information précédemment acquise, qui détermine la pertinence relative des catégories d'informations (par ex., un item devient moins pertinent s'il a été sélectionné précédemment), enfin l'état de la solution, qui détermine la mise à jour des critères de sélection (nature de l'information qui reste à chercher). Dans tous les cas le processus de sélection est complexe car il requiert l'activation de trois types de représentations mentales : la représentation du but ; la représentation des catégories précédemment visitées ; la représentation des catégories disponibles à un instant t.

Facteurs influençant la sélection

Les recherches sur les mécanismes cognitifs de la sélection d'informations ont commencé bien avant l'apparition des systèmes hypermédias, puisque les premiers travaux remontent aux années 60. En effet, les concepteurs des bases de données à menus se sont très tôt intéressés à l'effet de différents modes d'organisation des menus sur la facilité d'accès à l'information. Ces recherches et celles qui ont suivi ont mis en évidence le rôle de plusieurs paramètres, qui restent pertinents dans le cadre des hypertextes.

Giroux, Bergeron et Lamarche [GIR 87] ont réalisé une expérience pour étudier l'effet de l'organisation sémantique des menus sur la sélection. Le matériel se composait d'un ensemble de 10 pages-menus comportant chacune 8 ou 9 options. Les options étaient soit regroupées sémantiquement en deux catégories, soit présentées aléatoirement. Les auteurs ont montré que le temps de sélection moyen est plus court lorsque le menu est organisé de façon sémantique. Les auteurs notent toutefois que le problème de l'organisation optimale des menus est bien plus complexe si l'on considère les tâches de " catégorisation multiple ", où la pertinence de chaque catégorie évolue sur un continuum. La sélection serait alors sensible à des facteurs tels que typicalité, distance sémantique et familiarité du contenu.

Un autre facteur important dans l'organisation des systèmes à menus est le niveau de profondeur de l'arbre des choix. La profondeur (nombre de menus successifs à franchir avant d'atteindre la catégorie souhaitée) est facteur de lenteur et d'erreurs [KIG 84]. D'abord observé dans de simples systèmes à menus sans contenu textuel, ce résultat semble se retrouver dans les systèmes hypertextes [GOR 88, MOR 91]. Pour que la navigation soit possible, il faut que la destination des liens hypertextes soit parfaitement claire, et que l'utilisateur puisse situer chaque option dans le contexte général de l'hypertexte. Dans une série d’expériences, Tricot [TRI 95] a aussi montré que l’effet de la limite de la structure sur la compréhension du document ne dépendait pas seulement du niveau de profondeur mais aussi du niveau de largeur (i.e. du nombre d’ancres partant d’un nœud) et que cet effet s’exprimait différemment selon que le sujet voulait " tout comprendre " (lecture exhaustive) ou seulement comprendre un sous-ensemble de nœuds (lecture sélective). Enfin Dee Lucas [DEE 96] a montré que la représentation du contenu de l'hypertexte sous la forme de diagrammes hiérarchiques pouvait faciliter la sélection d'informations.

Une présentation structurée des catégories facilite la sélection, mais elle ne dispense pas les utilisateurs de consulter fréquemment la représentation d'ensemble de l'hypertexte (plan ou table des matières) ; ainsi quand les utilisateurs ont le choix entre passer d'un noeud à l'autre par des liens directs (ou menus enchâssés) ou repasser par la table des matières, c'est souvent cette dernière option qui est choisie [BRI 96]. Le parcours réel s'éloigne ainsi fréquemment du parcours " optimal ", ce qui permet à l'utilisateur de réaliser un compromis entre le coût des opérations cognitives impliquées dans la navigation et l'économie du parcours.

Le traitement des unités d'informations

Définitions

Par traitement nous entendons l'ensemble des processus qui se déroulent lorsque l'utilisateur examine une unité de contenu ou " page " du système d'informations. C'est délibérément que nous choisissons le terme vague de " traitement " pour caractériser cette phase de l'activité car la nature exacte des processus qui s'y déroulent est extrêmement variable selon le type d'informations disponibles (texte, images, sons) et le contexte d'activité. Pour simplifier, nous nous en tiendrons au cas de la recherche d'informations ponctuelles dans les systèmes à base de texte. Le " traitement " s'apparente alors à la lecture-compréhension et peut être décrit par un modèle comme celui de Kintsch (Cf. partie 2 ci-dessus). Toutefois ce modèle doit être complété dans le cas de la recherche d'informations. En effet le sujet ne cherche pas à construire une représentation globale du texte ; il cherche à en extraire certains éléments pour résoudre un problème. Sauf dans le cas d'une recherche purement exploratoire, le sujet doit non seulement comprendre mais aussi évaluer la pertinence de l'information par rapport à son objectif. Le traitement réalisé dépend donc étroitement des buts subjectifs que le sujet s'est construit lors de la phase d'évaluation. On retrouve ici un phénomène déjà observé dans la compréhension de textes : la perspective prise par le lecteur influence la hiérarchisation des informations du texte, voire leur conservation en mémoire [PIC 77].

Comment, concrètement, ce " filtrage " se déroule-t-il ? On peut supposer qu'à chaque microcycle de traitement l’utilisateur élabore une représentation " locale " du passage traité, puis il évalue en quoi ce passage contribue à son but : la passage contient-il la (ou l'une des) donnée(s) recherchée(s) ? Contient-il des éléments utilisables pour construire une réponse (ou solution ?) ? Contient-il des éléments permettant d'infléchir les prochaines étapes de la recherche ? Si le passage correspond à l'un des critères courants, son contenu est intégré à la solution en cours d'élaboration. Si le passage en question n'est que partiellement utile, le sujet devra opérer une sélection en cours de traitement. Si le passage en question est totalement hors de propos, le sujet peut prendre la décision d'interrompre le traitement. Il devra alors déterminer pourquoi la sélection n'a pas donné le résultat escompté et mettre en œuvre une procédure de correction (remonter dans l'arbre des choix jusqu'au point où une décision erronée a été prise, ou modifier la représentation de but).

Facteurs influençant le traitement

Nous avons vu que le traitement est influencé par la présence de critères de pertinence de l'information. A l'inverse le traitement peut interférer avec la gestion cognitive du but. Les informations rencontrées peuvent contaminer la représentation de but même si elles ne sont pas directement pertinentes, et même se substituer à la représentation de but initiale. Une autre source de difficulté est le caractère fragmenté, décontextualisé de l'information présentée dans un hypertexte. Comme l'a souligné Foltz [FOL 96], dans l'hypertexte le sujet peut très bien passer directement d'un texte à un autre sans rapport direct. Il faut alors reconstituer une cohérence d'ensemble pour les informations lues, ce qui exige la production d'inférences supplémentaires.

Le maintien d'une représentation de but en cours de traitement peut être facilité par certains systèmes d'aide. Les traceurs, arbres dynamiques et autres systèmes d'enregistrement du parcours fournissent à l'utilisateur une " mémoire externe " qui facilite la progressions (L'utilisateur peut facilement vérifier qu'une catégorie a ou n'a pas été déjà examinée ; Cf. [ROU 90] pour une illustration expérimentale). Certains chercheurs [BEA 96] proposent des outils de prise de notes pour assister le traitement. Dans ce cas, les informations acquises peuvent être restructurées en cours de recherche, ce qui évite à l'utilisateur d'avoir à garde en tête les résultats intermédiaires. Une autre technique consiste à proposer des liens de type " annotation ", qui renvoient automatiquement à l'unité de départ. Ces liens sont particulièrement utiles dans le cas d'information annexes ou supplémentaires, telles que les définitions [BLA 92].

Figure 1. Le cycle Evaluation-Sélection-Traitement. Les processus d'évaluation, sélection et traitement se déroulent de façon séquentielle, mais ils supposent l'existence d'une représentation de but disponible à tout moment. Par ailleurs ces processus reposent sur les connaissances initiales du sujet et les " contraintes situationnelles ", parmi lesquelles ont peut ranger les caractéristiques de l'environnement (par exemple, ressources documentaires disponibles).

Dans la Figure 1, nous avons représenté une vue globale des étapes d'évaluation, sélection et traitement qui constituent le " cycle " élémentaire de la RI. Les flèches indiquent le sens de transmission des critères et/ou des contraintes qui influencent chacune des étapes. Ainsi il apparaît clairement que la représentation du but élaborée initialement influence à la fois la sélection des catégories d'informations (ou " navigation " dans l'hypertexte jusqu'à trouver un " noeud " pertinent) et le traitement du contenu du noeud sélectionné (lecture-compréhension du passage et intégration aux informations préalablement traitées). De même il est clair que le traitement de contenus ne marque la fin de la recherche que si l'évaluation qui suit indique qu'une solution satisfaisante a été trouvée.

Gestion cognitive de la recherche d'informations

L'évaluation, la sélection et le traitement constituent par hypothèse les processus de base de la RI. Il faut cependant s'interroger sur les conditions qui permettent le déclenchement et l'arrêt de chacun des processus au cours de l'activité. Dans la plupart des domaines d'activité cognitive complexe, les auteurs font appel à la notion de " gestion cognitive " (avec diverses variantes sur lesquelles nous ne nous étendrons pas) pour désigner des processus de second ordre qui anticipent ou supervisent l'exécution des processus plus élémentaires. C'est le cas par exemple de la notion de planification en production écrite ou de " contrôle métacognitif " (monitoring) en compréhension. Dans le cas de la RI, et en s'inspirant des domaines d'activités connexes, on peut distinguer trois processus de gestion cognitive : (a) décider du moment, de la séquence et des conditions de mise en œuvre des processus élémentaires, (b) vérifier leur résultat et (c) entreprendre les actions requises en cas de problème. On parlera respectivement de planification, contrôle et régulation pour désigner ces différents aspects de la gestion.

Planification

La planification est définie par Hoc comme l'élaboration et la mise en œuvre de plans dans la réalisation d'une tâche [HOC 87]. Dans le cas de la RI, planifier consiste à déterminer les moyens permettant d'atteindre l'information utile. La planification s'appuie sur les connaissances que l'individu peut activer lors de la lecture de la question ou de l'énoncé de problème, mais aussi sur sa connaissance de l'environnement de recherche (par ex., familiarité avec le contenu d'un cédérom), et enfin sa connaissance de la tâche prescrite : une même tâche pourra être planifiée à des degrés divers et de façon plus ou moins efficace par différents individus. Par ailleurs le " plan " de recherche se présente lui-même comme une représentation cognitive, c'est à dire une structure d'information en mémoire dont le sujet doit préserver l'activation et surtout l'intégrité. On peut penser que l'activation et l'intégrité dépendront du degré d'élaboration de cette représentation, c'est à dire du temps et des efforts qui auront été consacrés à la construire. En termes plus concrets on peut engager une RI avec un plan élaboré, cohérent et solide, ou au contraire avec un plan sommaire, incohérent et instable.

La planification en RI se rapproche de la planification dans d'autres activités cognitives complexes, telles que la production écrite [HAY80] ou la conception de logiciel [VIS 90]. Comme dans ces activités le plan n'est jamais définitif, mais peut être remis en cause en fonction des résultats intermédiaires. Ce sont les processus de contrôle et de régulation qui peuvent conduire à une telle remise en cause du plan.

Contrôle

La notion de contrôle évoque avant tout celle de surveillance d'un processus ou de vérification d'un résultat. Dans la RI le contrôle intervient dès la phase de sélection : après chaque sélection l'utilisateur doit vérifier que le nouvel état du système est compatible avec la structure de but. Par exemple l'utilisateur peut estimer qu'aucune des options proposées n'est intéressante et décider de revenir en arrière dans l'arbre des choix. Dans le cas où la sélection aboutit à la présentation d'une page d'information, le contrôle prend place lorsque les informations ont été traitées, du moins en partie. Il s'agit alors de vérifier si les informations trouvées contribuent à la solution.

Si l'idée de contrôler la pertinence des informations trouvées semble relativement triviale, un tel contrôle ne va pas toujours de soi. Glenberg et ses collègues [GLE 82] ont montré que les lecteurs ont souvent du mal à prédire leur niveau de compréhension ; ils tendent généralement à surestimer leur performance (illusion of knowing). Par ailleurs on sait que les lecteurs ont parfois du mal à contrôler la cohérence globale des informations qu'ils traitent, ou même à remettre à jour leur représentation quand de nouvelles informations sont présentées [OOS inp].

Le problème du contrôle se pose avec encore plus d'acuité dans la recherche d'informations. Par définition le sujet ignore en grande partie la nature des informations qui vont lui permettre de résoudre le problème initial. Il lui est donc difficile de déterminer si les informations rencontrées sont nécessaires et/ou suffisantes. Rouet [ROU 94] a montré des élèves de 15 à 17 ans tendent à interrompre une tâche de recherche prématurément si la localisation des informations-cibles requiert un processus inférentiel. Ce résultat ne fait que corroborer une expérience de la vie quotidienne : c'est l'objet ou l'information que l'on s'irrite de ne pas " trouver " alors qu'on l'a virtuellement devant les yeux.

Régulation

Dans le cadre d'une activité de RI, réguler signifie modifier le décours de l'activité afin d'améliorer le résultat. La régulation peut intervenir à différentes étapes de l'activité et de différentes façons. Un premier niveau de régulation consiste à prendre en compte les informations acquises lorsque celles-ci sont pertinentes (c'est l'étape d'intégration dans le modèle proposé par Guthrie [GUT 88]). Toutefois d'autres formes de régulation sont possibles, notamment celles qui consistent à modifier le plan ou la représentation initiale du but lorsque ceux-ci ne donnent pas les résultats attendus. Ces régulations " réparatrices " sont particulièrement importantes lorsque le sujet n'est pas expert dans le domaine de connaissances considéré. De même la stratégie de sélection (exhaustive / auto-terminée) et de traitement (lecture rapide / approfondie) peuvent-elles être modifiées dynamiquement, en fonction des résultats intermédiaires de la recherche.

En résumé nous distinguons trois méta-processus de gestion des activités de RI : la planification ou préparation de l'activité ; le contrôle ou vérification du résultat en cours d'activité ; la régulation ou modification dynamique du décours de l'activité. Ces méta-processus sont différents des processus de base (évaluation, sélection et traitement) en ce qu'ils traitent non pas l'information de l'environnement, mais les résultats des processus de base. Sur les modalités concrètes de cette gestion nous n'avons pour le moment que très peu de données empiriques ; on ne connaît donc pas avec précision les facteurs qui influencent la capacité du sujet à planifier, contrôler et réguler sa recherche. On sait toutefois que dans la compréhension d'un texte, une gestion cognitive efficace est en général corrélée avec un bon niveau de compréhension (par ex. [PAR 83]). En d'autres termes des difficultés dans l'exécution de tâches de RI pourraient venir aussi bien de la mise en oeuvre des processus élémentaires (évaluation, sélection, traitement) que de leur gestion.

Discussion et conclusions

La recherche d'informations est un domaine en pleine expansion tant au plan technique que scientifique. Cette expansion est due entre autres à l'irruption des nouvelles technologies de l'information, qui offrent des outils plus sophistiqués et dans certains cas plus rapides pour exploiter des ressources documentaires de plus en plus volumineuses et complexes. Mais ces technologies soulèvent également de nombreuses interrogations : Sont-elles réellement efficaces ? Ne posent-elles pas plus de problèmes qu'elles n’en résolvent ? Quelles sont les compétences cognitives requises pour une utilisation optimale ? Ces compétences diffèrent-elles de celles qui sont requises pour effectuer les mêmes activités dans les environnement traditionnels ? La réponse à ces questions demande une analyse approfondie des mécanismes cognitifs qui sous-tendent la RI.

L'étude des processus de RI a été jusqu'ici dominée par une approche formelle, qui privilégie la définition de méthodes optimales à l'étude des méthodes naturelles employées par les utilisateurs. Cette approche formelle a fait ses preuves, notamment dans la conception de systèmes de recherche automatique. Elle peut également dans une certaine mesure fournir un cadre de départ à l'analyse des processus humains de recherche d'informations [ROU 95]. Il s'agit alors d'une base rationnelle qui décrit la méthode optimale pour une situation donnée. Toutefois, l'approche formelle ne peut se substituer à une approche réellement psychologique, centrée sur le comportement réel des chercheurs d'informations humains. Contrairement à l'approche formelle, l'approche psychologique tient compte des caractéristiques du système cognitif humain, et notamment de la capacité de traitement limitée de la MDT.

A partir de travaux plus anciens menés selon différentes perspectives, nous avons proposé un modèle cyclique de la RI dont les trois processus élémentaires sont l'évaluation, la sélection et le traitement. Ce modèle comporte également un second niveau de processus que nous appelons " gestion cognitive " de la RI. Trois mécanismes de gestion ont été définis : la planification, le contrôle et la régulation. Ce modèle, tout en restant largement hypothétique, permet de réinterpréter certains résultats empiriques concernant l'utilisation de systèmes hypertextes. Ainsi les phénomènes classiques de surcharge cognitive et de désorientation peuvent s'expliquer par la nécessité de maintenir actives en mémoire des représentations du but poursuivi, des informations déjà traitées, des options disponibles et de l'information perçue à l'instant t. Par ailleurs le fait que la stratégie de recherche repose sur une connaissance de l'environnement explique pourquoi, la plupart du temps, les systèmes proposant un nouveau format et/ou de nouveaux outils d'accès à l'information donnent de moins bons résultats - à contenu informatif constant - que des systèmes classiques objectivement moins performants.

Quelles peuvent être les conséquences pratiques d'une telle description générale des activités de RI ? Il existe déjà de nombreux exemples d'application de résultats de recherche pour l'amélioration ergonomique des systèmes d'informations (Cf. à ce sujet [MAR 95, ROU 96, WRI 90]. Le modèle que nous proposons permet de distinguer les aides aux processus de base des aides à la gestion. Tout système d'informations se doit d'abord d'assister l'utilisateur dans chacune des phases de la recherche. Il doit rendre possible et immédiate une évaluation des ressources disponibles, afin que l'utilisateur puisse élaborer un plan de recherche réaliste. Pour cela, le concepteur doit exploiter au mieux les techniques de visualisation globale du contenu. Le système doit ensuite faciliter les sélections. Ceci demande d'abord une catégorisation qui soit intelligible par l'utilisateur, et qui réalise un compromis entre largeur et profondeur des niveaux de choix. Ensuite le contenu des catégories doit être explicite. Dans beaucoup de systèmes actuels, une iconographie abusive et obscure rend parfois difficile l'interprétation des liens et/ou des boutons de navigation. Enfin le système doit faciliter le traitement du contenu. Ici tous les paramètres de lisibilité identifiés en ergonomie peuvent s'appliquer (Cf. Caro et Bétrancourt, ce volume). De plus, il est essentiel que les " pages " du système comportent des organisateurs typo-dispositionnels interprétables par le lecteur. Trop souvent les concepteurs abusent des possibilités offertes par les nouveaux média, et proposent par exemple des paginations séduisantes au premier coup d'oeil mais qui s'avèrent rapidement illisibles.

L'aide à la gestion cognitive est un problème plus délicat, mais qui n'en doit pas moins être abordé. Au niveau de la planification, l'utilisateur pourra apprécier la possibilité de faire des présélections dans le système (à la façon des outils proposés par Beaufils, [BEA 96]). Pour ce qui concerne le contrôle et la régulation, les choses se compliquent sérieusement. Pour apporter une aide efficace, le système doit en effet avoir une représentation de l'objectif de l'utilisateur. Cette représentation permettrait de calculer les écarts entre les sélections faites par l'utilisateur et les " cibles " correspondant objectivement à l'objectif (sur la base par exemple d'une analyse sémantique de la représentation de but). Celle-ci ne peut être réellement capturée que par un système à base de langage naturel. Or ce point constitue une pierre d'achoppement que les chercheurs sont loin d'avoir contournée.

Les limites du type de modèle que nous proposons se trouvent clairement dans sa généralité. Dans bien des cas, la recherche d'informations s'insère dans un contexte de tâche très particulier, notamment dans les environnements de travail. Aux besoins fondamentaux de l'utilisateur s'ajoutent des besoins et des contraintes spécifiques à la tâche. Il est alors nécessaire d'élaborer des modèles bien plus spécifiques pour concevoir des systèmes adaptés (Cf. [SAM 96] pour un exemple). Mais quel que soit la spécificité du système considéré, il est nécessaire de prendre en compte les besoins de l'utilisateur dès les premières phases de la démarche de conception (on trouvera plusieurs exemples dans [INS 96] et dans d'autres chapitres du même ouvrage).

En résumé, le modèle hypothétique présenté dans cet article a pour but de mieux comprendre certaines difficultés de l'utilisateur, telles que le maintien et la mise jour des objectifs de recherche. Il permet également de faire certaines recommandations très générales sur la conception des systèmes d'informations. Toutefois il s'agit encore d'un domaine d'investigation relativement nouveau et on ne peut que souligner le besoins de poursuivre les recherches dans ce domaine, tant sur un plan théorique qu'expérimental.

Bibliographie

[AND 83] Anderson J.R., The architecture of cognition, Harvard University Press, 1983.

[ARM 93] Armbruster B.B., Armstrong J.O., " Locating information in text : a focus on children in the elementary grades ", Contemporary Educational Psychology, vol. 18, p. 139-161, 1993.

[BAK 94] Baker L., Brown A.L., " Metacognitive skills and reading ", in P.D. Pearson (Ed.), Handbook of reading research, Longman, p. 353-394, 1984.

[BLA 92] Black A., Wright P., Black D., Norman K., " Consulting on-line dictionary information while reading ", Hypermedia, vol. 4, n° 3, p. 145-169, 1992.

[BRI 96] Britt M.A., Rouet J.-F., Perfetti C.A., " Using hypertext to study and reason about historical evidence ", in J.-F. Rouet, J.J., Levonen, A.P. Dillon, R.J. Spiro (Eds.), Hypertext and Cognition, Lawrence Erlbaum Associates, 1996.

[DEE 96] Dee Lucas D., " Effects of overview structure on study strategies and text representations for instructional hypertext ", in J.-F. Rouet, J.J., Levonen, A.P. Dillon, R.J. Spiro (Eds.). Hypertext and Cognition, Lawrence Erlbaum Associates, p.73-108, 1996.

[DIJ 83] van Dijk T.A., Kintsch W., Strategies of discourse comprehension, Lawrence Erlbaum Associates, 1983.

[ERI 95] Ericsson K.A., Kintsch W., " Long-term working memory ", Psychological Review, vol. 102, n° 2, p. 211-245, 1995.

[FOL 96] Foltz P.W., " Comprehension, coherence and strategies in hypertext and linear text ", in J.-F. Rouet, J.J., Levonen, A.P. Dillon, R.J. Spiro (Eds.), Hypertext and Cognition, Lawrence Erlbaum Associates, p.109-136, 1996.

[FOS 88] Foss C.L., " Effective browsing in hypertexts systems ", in RAIO Conference : User-oriented content based text and image handling, Cambridge, 1988.

[FOS 89] Foss C.L., " Tools for reading and browsing hypertext ", Information Processing and Management, vol. 25, n° 4, p. 407-418, 1989.

[GIR 87] Giroux L., Bergeron G., Lamarche J.-P., " Organisation sémantique des menus dans les banques de données ", Le Travail Humain, vol. 50, n° 2, p. 97-107, 1987.

[GLE 82] Glenberg A.M., Wilkinson A., Epstein W., " The illusion of knowing : failure in the assessment of comprehension ", Memory and Cognition, vol. 10, p. 597-602, 1982.

[GLE 87] Glenberg A.M., Meyer M., Lindem K., " Mental models contribute to foregrounding during text comprehension ", Journal of Memory and Language, vol. 26, p. 69-83, 1987.

[GOR 88] Gordon S., Gustavel J., Moore J., Hankey J., " The effect of hypertext on reader knowledge representation ", Proceedings of the 32nd Annual Meeting of the Human Factors Society, Human Factors Society, p. 296-300, 1988.

[GRA 90] Gray S.H., " Using protocol analyses and drawing to study mental model construction during hypertext navigation ", International Journal of Human-Computer Interaction, vol. 2, n° 4, p. 359-377, 1990.

[GUT 88] Guthrie J.T.., " Locating information in documents : examination of a cognitive model ", Reading Research Quarterly, vol. 23, p. 178-199, 1988.

[HAY 80] Hayes J., R., Flower L., S., " Identifying the organisation of writing process ", in L.W. Gregg, E.R. Steinberg (Eds.), Cognitive process in writing, Lawrence Erlbaum Associates, p. 3-30, 1980.

[HOC 87] Hoc J.-M., Psychologie cognitive de la planification, PUG, 1987.

[INS 96] Instone K., Teasley B., Leventhal L., " Lessons learned from ressinging hypertext user interfaces ", in H. van Oostendorp, S. de Mul (Eds.), Cognitive aspects of electronic text processing, Ablex, p. 256-286, 1996.

[KIG 84] Kiger J.I., " The depth-breadth tradeoff in the design of menu-driven user interfaces ", International Journal of Man-Machine Studies, vol. 20, p. 201-213, 1984.

[KIN 78] Kintsch W., van Dijk T.A., " Toward a model of text comprehension and production ", Psychological Review, vol. 85, p. 363-394, 1978.

[KIN 85] Kintsch W., Greeno J.G., " Understanding and solving word arithmetic problems ", Psychological Review, vol. 92, p. 109-129, 1985.

[KIN 88] Kintsch W., " The role of knowledge in discourse comprehension : a Construction - Integration model ", Psychological Review, vol. 95, n° 2, p. 163-182, 1988.

[KOV 86] Koved L., Shneiderman B., " Embedded menus : Selecting items in context ", Communications of the ACM, vol. 29, n° 4, 312-318, 1986.

[MAR 95] Marchionini G., Information seeking in electronic environments, Cambridge University Press, 1995.

[MOR 87] Morrow D.G., Greenspan S.L., Bower G.H., " Accessibility and situation models in narrative comprehension ", Journal of Memory and Language, vol. 16, p. 165-187, 1987.

[MOR 91] Moreira A., " Didactique et hypermédias en situation de résolution de problème : principes de conception des didacticiels hypermédias ", in B. de La Passardière, G.-L. Baron (Eds.), Hypermédias et Apprentissages, INRP, p. 37-44, 1991.

[OOS inp] van Oostendorp H., Goldman S.R. (Eds.), The construction of mental representations during reading, Lawrence Erlbaum Associates, in press.

[PAR 83] Paris S.G., Lipson J.E., Wixson K.K., " Becoming a strategic reader ", Contempory Education Psychology, vol. 8 (3), 293-316, 1983.

[PIC 77] Pichert D.E., Anderson R.C., " Taking different perspectives on a story ", Journal of Educational Psychology, vol. 69, p. 309-315, 1977.

[ROU 90] Rouet J.-F., " Interactive text processing in inexperienced (hyper-) readers ", in A. Rizk, N. Streitz, J. André (Eds.), Hypertexts : Concepts, systems and applications, Cambridge University Press, p. 250-260, 1990.

[ROU 94] Rouet J.-F., " Question answering and learning with hypertext ", in R. Lewis, P. Mendelsohn (Eds.), Proceedings of IFIP WG3.3. workshop : lessons from learning, North Holland, p. 39-52, 1994.

[ROU 95] Rouet J.-F., Tricot A., " Recherche d'informations dans les systèmes hypertextes : des représentations de la tâche à un modèle de l'activité cognitive ", Sciences et Techniques Educatives, vol. 2, n° 3, p. 307-331, 1995.

[ROU 96] Rouet J.-F., Levonen J.J., Dillon, A.P., Spiro, R.J. (Eds.), Hypertext and cognition, Lawrence Erlbaum Associates, 1996.

[SAM 96] Samurçay R., Hoc J.-M., " Causal versus topographical support for diagnosis in dynamic situation ", Le Travail Humain, vol. 59, p. 45-58, 1996.

[TRI 95a] Tricot A., " Un point sur l’ergonomie des interfaces hypermédia ", Le Travail Humain, vol. 58, n° 1, 17-45, 1995.

[TRI 96a] Tricot A., Bétrancourt M., Dufresne A., Merlet S., Rouet J.-F., de Vries E., " Des hypermédias pour quoi faire ? L’apport des modèles de tâches à la conception d’hypermédias pour l’apprentissage ", in E. Bruillard, J.-M. Baldner., G.-L. Baron (Eds.), Hypermédias et Apprentissages 3, INRP - EPI, p. 257-272, 1996.

[TRI inp] Tricot A., Puigserver E., Berdugo D., Diallo M., " The validity of rational criteria for the interpretation of user-hypertext interaction ", Interacting with Computers, in press.

[VIS 90] Visser W., Hoc J.-M., " Expert software design strategies ", in J.-M. Hoc, T.R.G. Green, R. Samurçay, D. Gilmore (Eds.), Psychology of programming, Academic Press, p. 235-250, 1990.

[VRI 94] De Vries E., Structuring information for design problem solving, Thèse de l’Université d'Eindhoven, 1994.

[WIN 91] Wineburg S.S., " Historical problem solving : a study of the cognitive processes used in the evaluation of documentary and pictorial evidence ", Journal of Educational Psychology, vol. 83, p. 73-87, 1991.

[WRI 90a] Wright P., " Hypertext as an interface for learners : some human factors issues ", in D.H. Jonassen, H. Mandl (Eds.), Designing hypermedia for learning, Springer Verlag, p. 169-184, 1990.