OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Régularisation spatiale de représentations distribuées de mots

Mousset, Paul and Pitarch, Yoann and Tamine-Lechani, Lynda Régularisation spatiale de représentations distribuées de mots. (2019) In: 16e Conférence francophone en Recherche d'Information et Applications (CORIA 2019), 25 April 2019 - 29 April 2019 (Lyon, France).

[img]
Preview
(Document in English)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
628kB

Abstract

Stimulée par l’usage intensif des téléphones mobiles, l’exploitation conjointe des don-nées textuelles et des données spatiales présentes dans les objets spatio-textuels (p. ex. tweets)est devenue la pierre angulaire à de nombreuses applications comme la recherche de lieux d’attraction. Du point de vue scientifique, ces tâches reposent de façon critique sur la représentation d’objets spatiaux et la définition de fonctions d’appariement entre ces objets. Dans cet article,nous nous intéressons au problème de représentation de ces objets. Plus spécifiquement, confortés par le succès des représentations distribuées basées sur les approches neuronales, nous proposons de régulariser les représentations distribuées de mots (c.-à-d. plongements lexicaux ou word embeddings), pouvant être combinées pour construire des représentations d’objets,grâce à leurs répartitions spatiales. L’objectif sous-jacent est de révéler d’éventuelles relations sémantiques locales entre mots ainsi que la multiplicité des sens d’un même mot. Les expérimentations basées sur une tâche de recherche d’information qui consiste à retourner le lieu physique faisant l’objet (sujet) d’un géo-texte montrent que l’intégration notre méthode de régularisation spatiale de représentations distribuées de mots dans un modèle d’appariement de base permet d’obtenir des améliorations significatives par rapport aux modèles de référence.

Item Type:Conference or Workshop Item (Paper)
Additional Information:Thanks to Association Francophone de Recherche d'Information et Applications (ARIA). The original PDF is available at: http://www.asso-aria.org/coria/2019/CORIA_2019_paper_23.pdf
HAL Id:hal-02494102
Audience (conference):National conference proceedings
Uncontrolled Keywords:
Institution:French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Other partners > Atos (FRANCE)
Laboratory name:
Funders:
Programme de recherche ANRT CIFRE numéro 2016/403
Statistics:download
Deposited On:31 Jan 2020 10:55

Repository Staff Only: item control page