Stratégies pour l'anonymisation systématique d'un corpus d'interactions plurilingues

Christophe Reffay 1 François-Marie Blondel 1 Emmanuel Giguet 2
2 Equipe Hultech - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : Dans le champ de l'analyse des interactions textuelles, les chercheurs désirant partager leurs corpus font face à de grandes difficultés pour en éliminer les marques d'identification des personnes physiques. La loi européenne suggère pourtant que ces marques soient soigneusement retirées avant toute publication. Dans la suite des outils de la plateforme Calico dédiée à l'analyse des interactions en ligne, nous proposons ici un procédé interactif d'anonymisation systématique, fonctionnant sans dictionnaire a priori et donc applicable à toute langue. Ce procédé a été appliqué à un premier corpus plurilingue issu de Galanet. Cet article souligne les difficultés de l'anonymisation et présente les premiers résultats de cette expérience. Au-delà de la transformation elle-même, nous proposons deux stratégies de fouille afin de détecter de nouvelles graphies pouvant révéler des données personnelles.
Type de document :
Communication dans un congrès
Degache, C. & Garbarino, S. Intercompréhension, Jun 2012, Grenoble, France. Université Stendhal Grenoble 3, pp.1-21, 2012, 〈http://ic2012.u-grenoble3.fr/OpenConf/papers/58.pdf〉
Liste complète des métadonnées

Littérature citée [16 références]  Voir  Masquer  Télécharger

https://edutice.archives-ouvertes.fr/edutice-00718390
Contributeur : Christophe Reffay <>
Soumis le : lundi 16 juillet 2012 - 18:52:32
Dernière modification le : mardi 5 juin 2018 - 10:14:40
Document(s) archivé(s) le : mercredi 17 octobre 2012 - 02:55:43

Fichier

ReffayBlondelGiguet_complet.pd...
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : edutice-00718390, version 1

Citation

Christophe Reffay, François-Marie Blondel, Emmanuel Giguet. Stratégies pour l'anonymisation systématique d'un corpus d'interactions plurilingues. Degache, C. & Garbarino, S. Intercompréhension, Jun 2012, Grenoble, France. Université Stendhal Grenoble 3, pp.1-21, 2012, 〈http://ic2012.u-grenoble3.fr/OpenConf/papers/58.pdf〉. 〈edutice-00718390〉

Partager

Métriques

Consultations de la notice

441

Téléchargements de fichiers

445