Anonymisation de corpus réutilisables : Masquer l'identité sans altérer l'analyse des interactions

Résumé : La mise à disposition de corpus de traces issues de formations en ligne intéresse la communauté scientifique dans sa démarche d'analyse des interactions humaines produites à travers le dispositif médiatisé. Pour des raisons éthiques, les échanges de corpus doivent garantir l'anonymat des acteurs concernés. Ce travail s'intéresse au processus d'anonymi¬sation d'un corpus pour en permettre un accès plus large. Les principes et l'outil d'anonymisation présentés sont appliqués à un corpus d'interactions en apprentissage des langues. Dans de telles situations, les marques d'identité à masquer sont tantôt des identifiants immuables produits par le système, tantôt des appellations ou interpellations produites par les acteurs eux-mêmes et sujettes à des variations syntaxiques parfois signifiantes et empreintes de culture (surnoms, diminutifs). Enfin, cette contribution pose la question de la frontière à définir entre le contexte socioculturel utile à l'analyse et l'identité de l'acteur à protéger.
Type de document :
Pré-publication, Document de travail
Soumis à la conférence EIAH'2007 : Environnements Informatiques pour l'Apprentissage Humain, acce.. 2007
Liste complète des métadonnées


https://edutice.archives-ouvertes.fr/edutice-00158877
Contributeur : Christophe Reffay <>
Soumis le : dimanche 1 juillet 2007 - 11:52:57
Dernière modification le : jeudi 1 décembre 2016 - 12:42:47
Document(s) archivé(s) le : vendredi 25 novembre 2016 - 16:28:08

Identifiants

  • HAL Id : edutice-00158877, version 1

Citation

Christophe Reffay, Philippe Teutsch. Anonymisation de corpus réutilisables : Masquer l'identité sans altérer l'analyse des interactions. Soumis à la conférence EIAH'2007 : Environnements Informatiques pour l'Apprentissage Humain, acce.. 2007. <edutice-00158877>

Partager

Métriques

Consultations de
la notice

245

Téléchargements du document

612