Anonymisation de corpus réutilisables : Masquer l'identité sans altérer l'analyse des interactions

Résumé : La mise à disposition de corpus de traces issues de formations en ligne intéresse la communauté scientifique dans sa démarche d'analyse des interactions humaines produites à travers le dispositif médiatisé. Pour des raisons éthiques, les échanges de corpus doivent garantir l'anonymat des acteurs concernés. Ce travail s'intéresse au processus d'anonymi¬sation d'un corpus pour en permettre un accès plus large. Les principes et l'outil d'anonymisation présentés sont appliqués à un corpus d'interactions en apprentissage des langues. Dans de telles situations, les marques d'identité à masquer sont tantôt des identifiants immuables produits par le système, tantôt des appellations ou interpellations produites par les acteurs eux-mêmes et sujettes à des variations syntaxiques parfois signifiantes et empreintes de culture (surnoms, diminutifs). Enfin, cette contribution pose la question de la frontière à définir entre le contexte socioculturel utile à l'analyse et l'identité de l'acteur à protéger.
Document type :
Preprints, Working Papers, ...
Complete list of metadatas

Cited literature [4 references]  Display  Hide  Download

https://edutice.archives-ouvertes.fr/edutice-00158877
Contributor : Christophe Reffay <>
Submitted on : Sunday, July 1, 2007 - 11:52:57 AM
Last modification on : Wednesday, September 18, 2019 - 1:30:05 AM
Long-term archiving on : Friday, November 25, 2016 - 4:28:08 PM

Identifiers

  • HAL Id : edutice-00158877, version 1

Citation

Christophe Reffay, Philippe Teutsch. Anonymisation de corpus réutilisables : Masquer l'identité sans altérer l'analyse des interactions. 2007. ⟨edutice-00158877⟩

Share

Metrics

Record views

390

Files downloads

879