OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Accélération par pré-agrégations des accès complexes et répétitifs aux Big Data

El Malki, Nabil Accélération par pré-agrégations des accès complexes et répétitifs aux Big Data. (2018) In: 36e Congres INFormatique des ORganisations et Systemes d’Information et de Decision - Forum Jeunes Chercheurs (INFORSID 2018), 28 May 2018 - 31 May 2018 (Nantes, France).

[img]
Preview
(Document in French)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
95kB

Official URL: http://inforsid.fr/Nantes2018/docs/ActesJCJC2018/inforsid_JCJC_2018_paper_5.pdf

Abstract

Contexte: L’humanité produit des quantités de données numérisées dans des proportions et avec un rythme sans commune mesure avec le passé. Ces masses de données,désignées communément comme Big Data, sont entreposées dans des clusters de stockage où les données sont plus ou moins structurées. Ces masses de données sont ensuite exploitées par des analystes (((data scientists))) qui utilisent des chaînes complexes de traitements, afin d’extraire les phénomènes contenus dans les masses de données. Ces traitements consistent à explorer les données, les classifier suivant des approches supervisées, semi-supervisées ou encore non supervisées. Par exemple, les données radars dans l’aviation civile sont stockées sous forme binaire par traces radars reconstituées. Un accès répétitif consiste à extraire toutes les trajectoires dans une fenêtre spatio-temporelle de l’espace aérien 3D. Un tel traitement réclame de nombreux accès aux données brutes pour constituer une réponse. L’aspect répétitif est induit notamment lorsque plusieurs requêtes demandent des calculs élémentaires communs répétés sur les données brutes. Par exemple, calculer le nombre de trajectoires par semaine dans une fenêtre de l’espace aérien revient à agréger 7 calculs de trajectoires quotidiennes.

Item Type:Conference or Workshop Item (Paper)
HAL Id:hal-02879717
Audience (conference):National conference proceedings
Uncontrolled Keywords:
Institution:Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Laboratory name:
Statistics:download
Deposited On:19 Jun 2020 12:03

Repository Staff Only: item control page