INRP Technologies nouvelles et éducation

Documents et rapports de recherche


 

Exploration des valeurs aspectuelles d'un temps du français :
transfert d'expertise et environnement d'apprentissage

Présentation générale
Le système aspecto-temporel
Les concepts relatifs à la catégorie aspecto-temporelle et leurs représentations

 
L'exploration contextuelle - l'expertise

Nous allons exposer maintenant la stratégie d'exploration contextuelle qui permet d'associer à chaque occurrence particulière d’une forme verbale une valeur déterminée. Puisque le français ne marque pas l'aspect par un morphème verbal spécialisé, il faut identifier dans le contexte les indices lexicaux et syntaxiques pertinents qui permettent de définir une configuration dans laquelle s'exprime telle ou telle valeur. Une fois que l'expert linguiste a caractérisé ces configurations, il les formalise dans un ensemble de règles logiques à partir desquelles un système expert doit être capable, en vérifiant les conditions requises, de déterminer la valeur sémantique de l'occurrence d'un temps dans une proposition.

Voici par exemple deux règles définissant la configuration de valeurs de l'imparfait :

    si dans une proposition on trouve une occurrence du verbe être à l'imparfait et s'il s'agit de l'expression "être en train de" et si cette expression est suivie d'un infinitif alors on attribue la valeur de processus en développement à cette proposition.

    si dans une proposition on trouve une occurrence d'un verbe à l'imparfait et si dans la même proposition on trouve un marqueur de fréquence (adverbe ou expression temporelle), alors on attribue la valeur d'habitude à cette proposition.

On voit tout de suite que l'application de telles règles nécessite une analyse morphologique et syntaxique préalable de la phrase, puisqu'il faut reconnaître les propositions, les formes canoniques (lemmes) et les catégories de certains mots (verbe, infinitif, substantif, adverbe, etc.) et l'utilisation d'un lexique.

L'ensemble de ces règles constitue la base de connaissances sur laquelle va fonctionner le système expert. Les listes lexicales (le lexique du système), auxquelles viennent s’ajouter les résultats de l’analyse préalable du texte examiné, constituent la base de faits sur laquelle s’appliquent les règles de détermination décrites ci-dessus. Ces règles ont été formulées dans le langage snark [Laurière 88].

A l'heure actuelle, la base de connaissances construite autour de l'imparfait et du passé composé compte environ 200 règles heuristiques de ce type. L'ensemble des règles heuristiques de détermination des valeurs pour les deux temps concernés a été établi à partir d'un corpus d'extraits de textes pris dans des romans, des articles de journaux ou de revues, des exemples connus de grammairiens, etc.

Chaque règle ou groupe de règles correspond à un cas de figure d’une des valeurs décrites. Nous n’entrons pas ici dans ce détail, on peut consulter cette classification, valeur par valeur, dans l’aide hypertexte qui accompagne le logiciel.
 
L'environnement d'apprentissage