OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Apprentissage de représentations de documents et leur exploitation en recherche d'information

Belkacem, Thiziri and Dkaki, Taoufiq and Moreno, José G. and Boughanem, Mohand Apprentissage de représentations de documents et leur exploitation en recherche d'information. (2017) In: 14e Conference francophone en Recherche d'Information et Applications (CORIA 2017), 29 March 2017 - 31 March 2017 (Marseille, France).

[img]
Preview
(Document in French)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
254kB

Official URL: https://doi.org/10.24348/coria.2017.RJCRI_14

Abstract

Afin de calculer la similarité document-requête, la majorité des modèles en recherche d'information (RI) représentent les documents et les requêtes sous forme de « sacs de mots » (bag of words) pondérés ou un sac de concepts, issus d'une ontologie linguistique ou construits automatiquement par des techniques de type LSI ou LDA, pour combler l'écart entre le vocabulaire utilisé par la requête et celui présenté dans les documents. D'autres approches dites word2vec proposent de modéliser les termes sous forme de vecteurs. Les approches word2vec permettent de capturer des relations au-delà de la co-occurrence, nous permettant ainsi de modéliser des relations sémantiques entre les termes. Dans cet article, nous présenterons l'état de l'art sur l'usage de ce type d'approches ainsi que notre contribution à l'exploitation de ce type d'approches dans les modèles de la RI.

Item Type:Conference or Workshop Item (Paper)
HAL Id:hal-02559775
Audience (conference):National conference proceedings
Uncontrolled Keywords:
Institution:Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Laboratory name:
Statistics:download
Deposited On:20 Apr 2020 15:11

Repository Staff Only: item control page