s'authentifier
version française rss feed
Fiche détaillée
Liste des fichiers attachés à ce document : 
DOC
Reffay_Teutsch.doc(216 KB)
PDF
Reffay_Teutsch.pdf(413.7 KB)
Anonymisation de corpus réutilisables
Christophe Reffay1, Philippe Teutsch2
(01/07/2007)

La mise à disposition de corpus de traces issues de formations en ligne intéresse la communauté scientifique dans sa démarche d'analyse des interactions humaines produites à travers le dispositif médiatisé. Pour des raisons éthiques, les échanges de corpus doivent garantir l'anonymat des acteurs concernés. Ce travail s'intéresse au processus d'anonymi¬sation d'un corpus pour en permettre un accès plus large. Les principes et l'outil d'anonymisation présentés sont appliqués à un corpus d'interactions en apprentissage des langues. Dans de telles situations, les marques d'identité à masquer sont tantôt des identifiants immuables produits par le système, tantôt des appellations ou interpellations produites par les acteurs eux-mêmes et sujettes à des variations syntaxiques parfois signifiantes et empreintes de culture (surnoms, diminutifs). Enfin, cette contribution pose la question de la frontière à définir entre le contexte socioculturel utile à l'analyse et l'identité de l'acteur à protéger.
1 :  LIFC – Laboratoire d'Informatique de Franche-Comté
2 :  LIUM – Laboratoire d'Informatique de l'Université du Maine
Interactions Homme-Homme médiatisées, Corpus de données d'apprentissage, Echange de corpus, Anonymisation

tous les articles de la base du CCSd...