Choisir la langue :

Étiqueter et contrôler la qualité des clusters pour le processus d'analyse diachronique de données textuelles

Institutional tag: 

Au sein du projet ISTEX-R, nous avons pour mission de faciliter le suivi de l'évolution de la production scientifique à travers l'étude de la base de publications ISTEX. Dans ce cadre, nous avons mis en place une solution de clustering diachronique qui permet de suivre les thématiques de recherche à travers le temps : fusion, séparation, apparition, disparition. Nous détaillerons dans un premier temps des outils de mesure de qualité et d'étiquetage de cluster nécessaires à notre démarche. Nous décrirons ensuite les principes de notre méthode d'analyse diachronique. Enfin, nous présenterons des résultats sur un corpus ISTEX à l'aide d'une plateforme de visualisation dédiée à l'exploration de ces résultats.

Dates: 
Thursday, March 24, 2016 - 11:00
Location: 
INRIA, bat. B, local B21
Speaker(s): 
Nicolas Dugué
Affiliation(s): 
LORIA