OATAO - Open Archive Toulouse Archive Ouverte Open Access Week

Entrepôts de données orientés documents : cuboïdes étendus - Modèles et cuboïdes NoSQL orientés documents

Chevalier, Max and El Malki, Mohammed and Kopliku, Arlind and Teste, Olivier and Tournier, Ronan Entrepôts de données orientés documents : cuboïdes étendus - Modèles et cuboïdes NoSQL orientés documents. (2017) Document numérique, 20 (1). 9-38. ISSN 1279-5127

[img]
Preview
(Document in French)

PDF (Author's version) - Requires a PDF viewer such as GSview, Xpdf or Adobe Acrobat Reader
1MB

Official URL: https://www.doi.org/10.3166/dn.2017.00001

Abstract

Avec l’essor ces dernières années des grandes plateformes Web (par exemple, Google, Facebook, Twitter, Amazon), ont été développées des solutions de gestion des mégadonnées (big data) basées sur des approches décentralisées permettant la gestion et le stockage de gigantesques masses de données. Cette approche décentralisée repose sur le principe de la scalabilité, c’est-à-dire l’ajustement d’une manière progressive et continue du stockage et des traitements au volume des données. Ce type d’architecture distribuée a connu récemment le développement de systèmes de gestion de fichiers massivement distribués et de nouvelles techniques de parallélisation massive des traitements. Adossés à ce contexte de distribution massive, différents systèmes de stockage sont apparus ces dernières années. Ces systèmes, qualifiés de systèmes not-only-SQL (ou NoSQL), relaxent les fondements de l’approche relationnelle pour pouvoir supporter les masses de données distribuées. De ce fait, il est envisageable de construire des entrepôts de données massives reposant sur ce principe de scalabilité de l’espace de stockage. Dans ce papier, nous étudions l’instanciation d’entrepôts de données avec les systèmes orientés documents. Dans un premier temps, nous étudions les enjeux primaires des entrepôts tels que la modélisation, l’interrogation, le chargement des données et les cubes OLAP. Dans un deuxième temps, nous proposons des améliorations qui sont spécifiques aux systèmes orientés documents. En particulier, nous proposons des versions étendues des cubes OLAP qui exploitent l’imbrication. Nous montrons que ces cubes répondent plus rapidement à des charges de travail composées de requêtes OLAP de type “drill-down”.

Item Type:Article
HAL Id:hal-02558102
Audience (journal):National peer-reviewed journal
Uncontrolled Keywords:
Institution:French research institutions > Centre National de la Recherche Scientifique - CNRS (FRANCE)
Université de Toulouse > Institut National Polytechnique de Toulouse - Toulouse INP (FRANCE)
Université de Toulouse > Université Toulouse III - Paul Sabatier - UT3 (FRANCE)
Université de Toulouse > Université Toulouse - Jean Jaurès - UT2J (FRANCE)
Université de Toulouse > Université Toulouse 1 Capitole - UT1 (FRANCE)
Laboratory name:
Statistics:download
Deposited On:29 Apr 2020 09:36

Repository Staff Only: item control page