OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Extraction de relations : Exploiter des techniques complémentaires pour mieux s'adapter au type de texte

Ghamnia, Adel and Kamel, Mouna and Trojahn, Cassia and Fabre, Cécile and Aussenac-Gilles, Nathalie Extraction de relations : Exploiter des techniques complémentaires pour mieux s'adapter au type de texte. (2017) In: 28es Journées Francophones d'Ingénierie des Connaissances (IC 2017), 5 July 2017 - 7 July 2017 (Caen, France).

[img]
Preview
(Document in French)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
278kB

Official URL: https://pfia2017.greyc.fr/share/actes/IC/Ghamnia_IC_2017.pdf

Abstract

Extraire des relations d'hyperonymie à partir des textes est une des étapes clés de la construction automatique d'ontologies et du peuplement de bases de connaissances. Plusieurs types de méthodes (linguistiques, statistiques, combinées) ont été exploités par une variété de propositions dans la littérature. Les apports respectifs et la complémentarité de ces méthodes sont cependant encore mal identifiés pour optimiser leur combinaison. Dans cet article, nous nous intéressons à la complémentarité de deux méthodes de nature différente, l'une basée sur les patrons linguistiques, l'autre sur l'apprentissage supervisé, pour identifier la relation d'hyperonymie à travers différents modes d'expression. Nous avons appliqué ces méthodes à un sous-corpus de Wikipedia en français, composé des pages de désambiguïsation. Ce corpus se prête bien à la mise en oeuvre des deux approches retenues car ces textes sont particulièrement riches en relations d'hyperonymie, et contiennent à la fois des formulations rédigées et d'autres syntaxiquement pauvres. Nous avons comparé les résultats des deux méthodes prises indépendamment afin d'établir leurs performances respectives, et de les comparer avec le résultat des deux méthodes appliquées ensemble. Les meilleurs résultats obtenus correspondent à ce dernier cas de figure avec une F-mesure de 0.68. De plus, l'extracteur Wikipedia issu de ce travail permet d'enrichir la ressource sémantique DBPedia en français : 55% des relations identifiées par notre extracteur ne sont pas déjà présentes dans DBPedia.

Item Type:Conference or Workshop Item (Paper)
Additional Information:Thanks to AFIA : Association Française pour l'Intelligence Artificielle.The original PDF is available at: https://pfia2017.greyc.fr/share/actes/IC/Ghamnia_IC_2017.pdf
Audience (conference):National conference proceedings
Uncontrolled Keywords:
Institution:Université de Toulouse > Institut National Polytechnique de Toulouse - INPT (FRANCE)
French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UPS (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Laboratory name:
Statistics:download
Deposited By: IRIT IRIT
Deposited On:19 Jun 2018 09:32

Repository Staff Only: item control page