Architecture distribuée d'un entrepôt pédagogique

Nawel Iles, Azeddine Chikh, Josiane Mothe
 

Résumé : Face à l'évolution rapide des moyens d'information et de communication dans le domaine de l'apprentissage automatique, une masse importante de ressources pédagogiques est produite à travers de nombreuses universités. La réutilisation des objets pédagogiques ainsi produits en local est faible et même inexistante entre les universités. Ceci peut s'expliquer en particulier par le manque de connaissance de la part des enseignants sur les ressources existantes. Nous proposons dans cet article un modèle d'entrepôt qui vise à palier ce déficit. Il s'agit d'un modèle d'entrepôt distribué qui repose sur la description par les métadonnées de LOM et l'indexation sémantique des objets pédagogiques. Nous supposons dans notre approche que chaque université dispose de son propre entrepôt, contenant des objets pédagogiques, leur description en métadonnées et leur description sémantique. Les métadonnées et les descripteurs de chaque entrepôt sont alors utilisés pour capitaliser les connaissances sur les objets distribuées et alimenter un méta entrepôt, comparable à un catalogue accessible par tous.

Mots-clés : apprentissage automatique, objet pédagogique, entrepôt, métadonnée LOM, indexation sémantique, partage, réutilisation.

1. Introduction et problématique

   Les Technologies de l'Information et de la Communication (TIC) améliorent profondément nos façons de nous informer, de communiquer et de nous former. Cette émergence technologique a fait apparaître un nouveau mode d'apprentissage connu sous le nom d'apprentissage automatique ou e-learning. L'apprentissage automatique est défini comme l'utilisation des nouvelles technologies multimédias et de l'internet, pour améliorer la qualité de l'apprentissage en facilitant l'accès à des ressources et des services, ainsi que des échanges et la collaboration à distance. Dans le domaine universitaire, les objets pédagogiques « OP » constituent l'ensemble des informations, parties de cours, de programmes, de thèses, etc. qui permettent de véhiculer et de transmettre des concepts et contenus d'enseignements. Un OP numérique peut être de différents formats : .pdf, .doc, .jpg, etc. Compte tenu du coût de production de telle ressource et de l'expertise nécessaire pour les produire, il est primordial de les rendre facilement accessibles, exploitables et réutilisables. Les travaux présentés dans cet article visent à proposer un modèle d'entrepôt qui permet de mémoriser de manière pérenne les ressources pédagogiques et de les indexer afin de faciliter leur accès et leur réutilisation.

   Les OP sont créés par différentes universités et sont essentiellement utilisées au sein de l'établissement qui les a créés. Ainsi, une université n'a pas accès aux OP des autres universités (sauf relations informelles entre enseignants). Il en résulte un manque de capitalisation des savoir-faire et des objets ; chaque université devant alors créer des objets qui ont les mêmes objectifs pédagogiques, sans prise en compte de l'existant. Compte tenu du coût de production de tels OP et de l'expertise nécessaire pour les produire, il est primordial de les rendre facilement accessibles, exploitables et réutilisables. La faible réutilisation des OP produits peut s'expliquer en particulier par le manque de connaissance chez les enseignants concepteurs de cours et des étudiants sur les objets déjà existants. Notre proposition vise à mettre à disposition les OP existants à un ensemble d'universités organisées en réseau. La mise à disposition des OP n'est pas suffisante pour garantir leur réutilisation. Elle doit s'accompagner de moyens de recherche et d'accès à l'information utile. La description LOM qui peut être associée à chaque OP constitue une première description indispensable à cet accès. Cependant elle n'encadre pas suffisamment les choix faits lors de la description des contenus des OP. À l'heure du Web sémantique, il est alors nécessaire d'associer des annotations sémantiques au contenu des OP pour permettre de les retrouver.

   Nous proposons dans ce travail de recherche un modèle d'entrepôt distribué qui repose sur la description des OP par les métadonnées de LOM et les concepts des ontologies de domaine. Ces deux descriptions complémentaires permettent l'interrogation sémantique des OP. Ainsi chaque université dispose de son propre entrepôt, contenant les OP, leurs métadonnées LOM et leurs annotations sémantiques. Les métadonnées et les annotations de chaque entrepôt local sont dupliquées dans un méta entrepôt central et partagé, accessible à partir d'un serveur commun. L'accès aux OP disponibles dans les autres entrepôts locaux est réalisé via le méta-entrepôt. Ce dernier est interrogé essentiellement par les étudiants dans le cadre de leur recherche bibliographique ou par les enseignants concepteurs de cours lors de l'élaboration d'un nouveau cours ou de l'enrichissement d'un cours existant.

   La suite de l'article est organisée comme suit. Dans la section 2, nous présentons l'état de l'art ; nous y abordons en particulier l'utilisation des entrepôts et celle des ontologies dans le domaine de l'apprentissage automatique. Dans la section 3, nous proposons l'architecture de l'entrepôt distribué des ressources pédagogiques universitaires et le modèle sous-jacent. La modélisation de l'entrepôt se base sur les normes de l'apprentissage automatique ainsi que leur représentation sémantique grâce aux ontologies. Nous terminons l'article par une conclusion et les perspectives aux travaux présentés.

2. État de l'art

2.2. Les entrepôts pédagogiques en apprentissage automatique 

Objet pédagogique

   En apprentissage automatique, la forme fondamentale d'une ressource pédagogique est l'« objet pédagogique » (OP) ; Le groupe de travail des IEEE-LTSC (Learning Technology Standards Committee) a proposé une définition d'un OP qui est la suivante : « Un objet pédagogique est défini comme toute entité numérique ou non qui peut être utilisée, réutilisée ou référencée pendant des activités d'apprentissage assistées par ordinateur (enseignement intelligent assisté par ordinateur, environnements d'enseignement interactifs, systèmes d'enseignement à distance, environnements d'apprentissage collaboratif). »

Entrepôt de données

   De nombreuses définitions d'un entrepôt ont été proposées, nous retenons celle de William H. Inmon (2002) « un entrepôt de données est une collection de données orientées sujet, intégrées, filtrées, non volatiles et historisées, organisées pour le support d'un processus d'aide à la décision ». Les données de l'entrepôt doivent avoir les caractéristiques suivantes :

  • Orientées sujet : les données doivent être classées par sujet ou par domaine ;
  • Intégrées : les données sont le résultat de l'intégration de données en provenance de sources différentes et hétérogènes ;
  • Historisées : l'entrepôt doit archiver les données dans leurs différentes versions ;
  • Filtrées : l'entrepôt ne doit contenir que des données pertinentes ;
  • Non volatile : les données sont stockées dans l'entrepôt et elles ne peuvent pas être modifiées.

   Les collections des OP sont régies par les mêmes caractéristiques. Chaque OP doit être sauvegardé de manière permanente, présenté sous différentes versions et peut être issu de différentes sources. Ainsi, nous proposons un entrepôt pédagogique qui permet de capitaliser non seulement les OP, mais aussi, toute sorte d'information liée à l'OP et qui peut être utile à l'utilisateur.

2.2. Modèle de description des Objets pédagogiques

   Afin de faciliter l'accessibilité, la recherche, le partage et la réutilisation, chaque OP doit être décrit à l'aide de métadonnées et d'annotations sémantiques. En effet, un OP non indexé ou annoté ne pourra pas être retrouvé et à fortiori réutilisé. Cette étape d'indexation est donc indispensable, elle a été abordée dans différents travaux présentés dans les paragraphes qui suivent.

Métadonnées

   Les métadonnées peuvent être définies comme étant des données relatives à d'autres données. Dans le domaine de l'apprentissage automatique, les métadonnées servent à décrire les documents pédagogiques afin de les rendre plus facilement identifiables (accessibles) et plus manipulables (interopérables, réutilisables, durables, adaptables). Ces métadonnées sont structurées suivant des catégories ou champs sémantiques « descripteurs ». Chaque champ représente une caractéristique particulière sur la ressource comme par exemple son titre (Bourda, 2001). Dans notre travail, nous nous appuyons sur LOM qui permet une description à la fois fine et précise.

Learning Object Metadata « LOM »

   Le standard LOM spécifie la syntaxe et la sémantique des métadonnées pédagogiques et définit les attributs nécessaires pour une description adéquate et complète des ressources pédagogiques. Il existe 78 attributs regroupés en neuf catégories :

  • Généralité : description de la ressource dans l'ensemble comme identifiant, titre, mots clés, etc. ;
  • Cycle de vie : description des caractéristiques relatives à l'historique de la ressource, son cycle de vie etc. ;
  • Méta-métadonnées : description de la ressource pédagogique elle-même comme Identifiant, Contribution, langage... ;
  • Technique : définir les techniques comme le type de donnée, le format, la taille, etc. ;
  • Pédagogie : caractéristiques pédagogiques ;
  • Droits : Coûts, copyrights, description... ;
  • Relation : caractéristiques exprimant les liens avec d'autres ressources comme Type (nature de la relation) ;
  • Annotation : commentaires sur l'utilisation pédagogique de la ressource : Auteur, date, description ;
  • Classification : caractéristiques de la ressource décrites par des entrées dans des systèmes de classification (but, classification de références, chemin...)

   Les caractéristiques de LOM ne sont pas toutes nécessaires pour une application donnée. Un profil d'application permet d'en limiter le nombre. Un profil d'application est un assemblage de métadonnées adaptées au contexte d'utilisation spécifique. Ce profil peut soit restreindre les descripteurs de LOM, soit les enrichir. Il existe de nombreux profils d'application : CanCore, Celebrate, Normetic, ManUel, etc.

Représentation sémantique des ressources pédagogiques

   LOM n'est pas assez puissant pour assurer le partage des OP et leur réutilisation entre les acteurs des différentes universités. En effet, la sémantique des contenus est mal représentée puisqu'elle se limite souvent à des mots clés. Afin de compléter la sémantique de l'indexation des OP, nous suggèrerons l'utilisation d'ontologies de domaine. En effet, une ontologie regroupe les concepts qui représentent l'ensemble des connaissances d'un domaine en une spécification explicite et formelle. Elle montre les relations ainsi que les règles d'associations qui existent entre ces concepts. Ainsi, une ontologie peut fournir le vocabulaire et sa sémantique, pour exploiter le contenu des métadonnées associées aux objets pédagogiques annotés (Hernandez et al., 2008).

   La description d'une ontologie repose sur différentes normes : RDF (Resource Description Framework), OWL (Web Ontology Language), etc. Différents travaux de la littérature s'intéressent à l'indexation ou l'annotation sémantique, citons les projets suivants :

  • Le projet TRIAL-SOLUTION (Buffa et al., 2005) : le but de ce projet est de développer les technologies nécessaires afin de permettre à l'enseignant, en se basant sur d'autres cours déjà existants, de construire un cours personnalisé. Trial Solution consiste à prendre chaque ressource pédagogique et la décomposer en objets pédagogiques. Chaque objet est alors représenté par des métadonnées, son contenu sémantique et sa relation avec les autres objets appartenant à la même ressource. Le découpage de la ressource se fait grâce à un outil développé par la société Slicing Information Technology (SIT). Ce découpage est représenté sous forme d'un arbre où chaque noeud correspond à un objet pédagogique. Un outil d'annotation a été développé par TRIAL-SOLUTION qui permet d'indexer chaque noeud par les métadonnées et par des termes d'un thésaurus. Une fois l'annotation terminée, la ressource peut être accessible à travers son entrepôt d'objets pédagogiques annotés. Cet entrepôt se base sur les annotations RDF du web sémantique. Son originalité est qu'il permet à l'enseignant de créer des cours sur mesure.

  • Le projet Memorae (MEMoire Organisationnelle Appliquée à l'apprentissage en ligne) (Abel et al., 2003) est un outil d'apprentissage en ligne et d'indexation de ressources. Cet outil permet à différents apprenants d'accéder à leurs ressources pédagogiques en se basant sur les ontologies. Cette approche concerne aussi bien le Web sémantique et l'ingénierie des connaissances que l'ingénierie pédagogique et l'EIAH. Memorae permet d'une part de capitaliser les ressources, les informations, les connaissances dans le cadre d'un apprentissage automatique, et d'autre part, de mieux les indexer et de gérer les relations qui existent entre elles. L'inconvénient de ce projet est qu'il n'y a aucune précision sur le parcours de ces documents (si les ressources sont crées spécialement pour l'entrepôt ou extraites de documents existants)..

  • Les travaux de (Bouzeghoub, 2005) consistent à la construction d'un entrepôt de donnée dans un cadre pédagogique. La description de ces ressources pédagogiques est basée sur une ontologie du domaine de connaissances. Cette description permet d'offrir des outils de recherche performants et favorise également la réutilisation. Ce modèle permet d'obtenir des ressources par assemblage de ressources existantes en utilisant des graphes et des opérateurs de décision.

  • Le projet Arpem (Archivage et Ressources PEdagogiques Multimédia) et le projet Ariadne (Chikh, 2003) ont eux aussi proposé un modèle d'un entrepôt d'objets pédagogiques. Ils représentent un outil de catalogage et d'archivage des ressources pédagogiques se basant sur les métadonnées de LOM. Seulement, le projet Arpem à la différence du projet Ariadne, est indépendant de toute plate-forme existante et permet d'apporter beaucoup plus en termes de qualité de développement des ressources documentaires en évitant les redondances de production et en facilitant la capitalisation.

   Les différents travaux cités se sont intéressés à la construction des entrepôts pédagogiques en se basant sur différentes façons d'annoter les OP et sur différentes approches : les projets Ariadne, Arpem sur les métadonnées, Memorae, Trial Solution et Karina sur les ontologies. Ce type de modèle permet à chaque université de construire son propre entrepôt pédagogique mais leurs contenus restent réservés toujours qu'à un public très limité. Pour faire face à cette contrainte et élargir la diffusion des OP, notre approche consiste à envisager un système qui permette, d'un coté de capitaliser les OP, les indexer afin de les rendre réutilisables et d'un autre côté qui permette à chaque OP annoté d'être accessible et exploité par les acteurs de différentes universités. Ainsi, nous proposons de construire un entrepôt pédagogique dit « serveur », qui il capitalise l'ensemble des OP annotés en un seul endroit.

3. Représentation et modélisation de l'entrepôt pédagogique distribué

3.1. Architecture d'un entrepôt local

   Le contenu de l'entrepôt pédagogique associé à une université, doit être constitué d'un ensemble de ressources pédagogiques de différents formats (pdf, doc, jpg, etc.) et sur différents supports (papier, électronique, multimédia, etc.). Une ressource pédagogique doit être sélectionnée et filtrée avant d'être stockée dans l'entrepôt. Une ressource pédagogique est composée d'un ensemble d'objets pédagogiques reliés entre eux. Chaque objet pédagogique est décrit par les métadonnées LOM afin de le retrouver et de le réutiliser. L'entrepôt pédagogique associé à une université sera composé de deux parties :

  • une base de données classique (relationnelles, orientées objets ou relationnelles-objets) qui va contenir l'ensemble des OP filtrées ;
  • un ensemble de descripteurs LOM et de descripteurs sémantiques résultant après la phase d'indexation.

   De cette façon, on sépare le stockage des OP de ses descripteurs tout en gardant un lien entre eux, et on facilite la recherche des OP en se basant sur les métadonnées LOM, et les annotations sémantiques. Notre entrepôt local est représenté par l'architecture suivante :

Modélisation d'un entrepôt
Figure 1. Modélisation d'un entrepôt local.

   L'intégration d'un OP dans l'entrepôt distribué se fait en deux phases :

1- Phase de filtrage : il s'agit de sélectionner les OP pertinents pour les capitaliser, tout en gardant les relations entre les objets appartenant à la même ressource.

2- Phase de qualification : à chaque OP sont associés un ou des descripteurs LOM et une ou des annotations sémantiques par rapport aux ontologies de domaine (Snae, 2007). La mise en relation entre les ontologies et les contenus des OP s'appuie sur les techniques d'indexation automatique telles qu'abordées par Hernandez (2005).

  • La description par les métadonnées de LOM permet de décrire et d'indexer tout OP. Les métadonnées obtenues permettent de donner les différents renseignements nécessaires sur chaque OP. Elles seront filtrées par un profil d'application. Cependant, comme nous avons déjà mentionné, la représentation sémantique se basant sur les normes n'est pas suffisante pour permettre la réutilisation des OP dans d'autres applications.

Description d'un objet
Figure 2. Description d'un objet pédagogique par LOM.

  • Afin d'assurer la réutilisation d'un OP, la représentation sémantique est basée sur la notion d'ontologie. Nous utilisons une ontologie de thème (Hernandez, 2005) de la formation qui rassemble les thèmes, notions et connaissances à appréhender. L'ontologie du thème de l'informatique est présentée dans la figure 3.

zoom

Figure 3. Extrait de l'ontologie du thème de l'informatique (Hernandez, 2005). [Zoom]

3.2. Architecture générale du méta entrepôt pédagogique

   Dans le cadre universitaire, il existe différentes sources des OP : supports de cours, exercices, thèses, rapports, etc., disponibles par les utilisateurs au niveau de chaque université. Cependant, il leur est impossible d'accéder de façon efficace, et de trouver les OP pertinentes adaptés à leurs besoins. D'un autre coté, ces OP restent localement réservés, et non accessibles par les utilisateurs d'autres d'universités. Dans notre approche, nous proposons une architecture distribuée qui consiste à mettre en place un système qui va permettre de :

  • Capitaliser au niveau de chaque université, tous les OP pertinents produites ;

  • Annoter chaque OP afin de la rendre accessible et réutilisable. Cette annotation se base sur une description par les métadonnées LOM et par les annotations sémantiques ;

  • Créer un méta-entrepôt pédagogique qui sera alimenté par l'ensemble des descripteurs des entrepôts des universités. Ainsi chaque ressource pourra être partagée entre universités et elle sera accessible à distance (tout en respectant les rassemblées dans un endroit unique.

   L'architecture générale du modèle est la suivante :

Architecture distribuée
Figure 4. Architecture distribuée de l'entrepôt pédagogique.

   Les entrepôts pédagogiques se basent sur deux types de structures, des structures spécifiques et une structure générique :

  • La structure spécifique caractérise l'organisation d'un OP, chaque entrepôt pédagogique peut contenir plusieurs structures logiques spécifiques. Elle permet la description sémantique d'un OP.

  • La structure générique représente une collection de représentation spécifique. Les entrepôts pédagogiques ayant des structures similaires ou identiques sont regroupés dans une même structure spécifique afin de faciliter la recherche.

3.3. Accès à la ressource pédagogique par l'apprenant

   Un apprenant d'une université peut rechercher des documents, soit dans son université ou dans les autres universités associées en prenant en compte les droits d'accès. L'interface pédagogique de notre système sera située alors au niveau du méta entrepôt.

Étapes d'accès à la ressource
Figure 5. Étapes d'accès à la ressource.

   Cette architecture requiert trois catégories d'acteurs, apprenant, auteur et l'expert :

  • Apprenant : il peut s'agir de toute personne universitaire voulant faire des recherches soit au niveau de son université ou à partir de l'ensemble des universités. Un enseignant peut aussi être un apprenant.

  • Auteur : il peut s'agir soit d'un enseignant qui veut enrichir l'entrepôt par ses ressources (polycopiés, exercices, etc.), un chercheur afin de publier ses ressources ou même des étudiants.

  • Administrateur : il doit superviser l'entrepôt serveur. Il permet d'alimenter l'entrepôt à partir des entrepôts locaux, et de veiller à sa mise à jour et à sa maintenance (droits d'accès, etc.).

   L'apprenant doit effectuer les étapes suivantes afin de satisfaire sa recherche :

  • s'identifier pour accéder à l'entrepôt serveur et formule sa recherche de ressource pédagogique, et obtenir les différents descripteurs associés parmi lesquels la localisation de la ressource ;

  • la demande sera traitée au niveau de l'entrepôt serveur qui, à travers les ressources pédagogiques annotées existantes, établit sa recherche ;

  • le résultat de la recherche sera communiqué à l'apprenant ;

  • l'apprenant va prendre directement contact avec l'entrepôt de l'université qui contient sa ressource pédagogique recherchée.

4. Conclusion

   Pour conclure, nous avons proposé un modèle d'entrepôt distribué qui permet l'indexation des objets pédagogiques, leur recherche et leur réutilisation de façon à répondre aux besoins des apprenants ou des enseignants.

   L'originalité de notre approche peut être résumée par le fait qu'elle :

  • s'appuie sur un enrichissement des descriptions LOM par des annotations sémantiques par rapport aux ontologies de domaine ;
  • repose sur une architecture distribuée où les spécificités de chaque université sont prises en compte ;
  • permet une interrogation homogène des objets existants via une méta description des objets ;
  • assure des possibilités avancées de traitement via l'utilisation des fonctionnalités d'un entrepôt de données.

   En vue de pouvoir retrouver les objets pédagogiques directement lors de l'implémentation d'un nouveau cours en ligne sur un LMS, nous comptons l'interfacer avec l'entrepôt distribué.

Nawel Iles*,
Azeddine Chikh*,
Josiane Mothe**

* Faculté des sciences de l'ingénieur. Université de Tlemcen.
Chetouane, BP 230 – 13000 Tlemcen – Algérie.
{n_iles, az_chikh}@univ-tlemcen.dz

** Institut de Recherche en Informatique de Toulouse. IRIT / équipe SIG.
118, Route de Narbonne, 31062 Toulouse cedex 04.
josiane.mothe@irit.fr

Le présent texte correspond à l'intervention de Mme Iles à la session 3 « Fédération des contenus, constitution des bases de données personnelles » du colloque international ePrep 2008.
http://www.eprep.org/colloques/colloque08/colloque08.php.

Bibliographie

Abel, M.-H., Lenne, D., Moulin, C., Benayache, A. (2003). Gestion des ressources pédagogiques d'une e-formation [Pedagogical resources for e-learning]. Document Numérique, 7 (1-2), p. 111-128.

Bourda, Y. (2001). Objets pédagogiques, vous ave dit objets pédagogiques ?, Supélec, Plateau de Moulon, F91192, GifsurYvette, CEDEX.

Bouzeghoub, A., Defude, B., Duitama, J.-F., Lecocq, C. (2005). Un modèle de description sémantique de ressources pédagogiques, basé sur une ontologie de domaine. Sticef, Volume 12.

Buffa, M., Dehors, S., Faron-Zucker, C., Sander, P. (2005), Vers une approche sémantique dans la conception d'un système d'apprentissage. Revue du projet TRIAL-SOLUTION, Plate forme AFIA nice.

Chikh, A. (2003). Une approche méthodologique de réutilisation en ingénierie de document. Thèse de Doctorat, Alger : INI.

Hernandez, N. (2005). Ontologies de domaine pour la modélisation du contexte en Recherche d'Information. Thèse de doctorat, Toulouse : Université Paul Sabatier.

Hernandez, N., Mothe, J., Ralalason, B., Ramamonjisoa, B., Stolf, P. (2008). A Model to Represent the Facets of Learning Objects. Interdisciplinary Journal of Knowledge and Learning Objects, Informing Science Institute, Volume 4, Santa Rosa-USA. (à paraître)

Inmon, W. H. (2002), Building the data warehouse. New-York.

Snae, C., Brueckner, M. (2007). Ontology-Driven E-Learning System Based on Roles and Activities for The Learning Environment. Interdisciplinary Journal of Knowledge and Learning Objects, Volume 3, p. 1-17.

Varlamis, I., Apostolakis, I. (2006). The Present and Future of Standards for E-Learning Technologies. Interdisciplinary Journal of Knowledge and Learning Objects, Volume 2, p. 59-76.

Références sur le WEB

Boutemedjet, S. (2004). Web Sémantique et e-Learning, [Semantic web and e-learning], Cours IFT6261.
http://www.iro.umontreal.ca/~aimeur/cours/ift6261/ Presentations-etudiants/WebSemantiqueE-learning.pdf.

Gašević, D., Hatala, M. (2005). Searching context relevant learning resource using ontology mappings, International Workshop on Applications of Semantic Web Technologies for E-learning (SW-EL), Winston-Salem State University.
http://www.win.tue.nl/SW-EL/2005/swel05-kcap05/proceedings.

Knight, C., Gašević, D., Richards, G. (2005). Ontologies to integrate learning design and learning content. Journal of Interactive Media in Education, (07), ISSN :1365-893X.
http://www-jime.open.ac.uk/2005/07/.

___________________
Association EPI
Septembre 2008

Retour