Effectuer une union de données

Last modified by Aurelie Bertrand on 2024/04/26 11:22

Il est possible d'unir les données de plusieurs modèles de données.

La combinaison des données se fait de manière verticale. Les données sont agrégées sous chaque colonne.

  1. Dans la boite Création d'un nouveau modèle de données, cliquez sur le bouton Union de la section Autres.
    Bouton_union
    ➡ La boîte de dialogue Union s'affiche.
    Union
  2. Sélectionnez les modèles de données que vous souhaitez utiliser en cliquant sur le bouton Ajouter puis en choisissant Existant (ou Nouveau pour créer un nouveau modèle de données.)
    Ajouter_modeles
    Les dimensions et les mesures des modèles sélectionnés sont agrégées en fonction de leur nom et de leur type. Si un objet porte le même nom et a le même type dans les différents modèles, on considère ainsi qu'il s'agit du même objet (il n'apparaîtra donc qu'une fois dans le modèle de données agrégé).
     
  3. Sélectionnez la manière dont vous souhaitez gérer les doublons dans la liste déroulante :
    • Pas d'exclusion : il s'agit de la valeur par défaut. Les doublons figurant dans les modèles de données sont conservés.
    • Tout dédoublonner : Cochez les dimensions qui seront utilisées comme clé pour déterminer les doublons. Seule la première valeur de clé trouvée est conservée. Les doublons (quelle que soit le modèle de données) sont tous éliminés.
    • Dédoublonner toutes les lignes sauf celle de la première source de données : Cochez les dimensions qui seront utilisées comme clé pour déterminer les doublons. Les doublons de la première source de données sont conservés, ceux trouvés dans les sources de données suivantes sont supprim
    • Dédoublonner toutes les lignes sauf celle de la même source de données: Cocher les dimensions qui seront utilisées comme clé pour déterminer les doublons. Les doublons figurant dans la même source de données sont conservés, ceux trouvés dans les sources de données suivantes sont supprimés.
  4. Sélectionnez Associer les colonnes clés pour créer des associations entre une ou plusieurs colonnes de dimensions « clés » de sources différentes.
    ➡ Les colonnes clés identifiées par le logiciel s'affichent dans la table Colonnes clés (hormis pour l'option Pas d'exclusion). Cochez la ou les dimension(s) clé(s) sur laquelle ou lesquelles sera effectuée l'union. Les dimensions clés doivent exister dans tous les modèles sélectionnés.

Exemple de création d'une union entre deux tables

L'utilisateur souhaite réaliser une union entre deux modèles de données : Ventes1 basé sur le fichier Ventes1.xls et Ventes2 basé sur le fichier excel Ventes2.xls.

Fichier Ventes1.xls :

DateProduitPrix unitaireQuantitéPrix total
24/12/11Ref23211352
24/12/11Ref31214168
24/12/11Ref510660
24/12/11Ref31215180
24/12/11Ref23224768

Fichier Ventes2.xls :

DateProduitPrix unitaireQuantitéPrix total
24/12/11Ref2326192
24/12/11Ref312448
24/12/11Ref6186108
24/12/11Ref1520100
24/12/11Ref44023920
24/12/11Ref31210120
24/12/11Robe10330
24/12/11Ref31212144
24/12/11Ref23223736
24/12/11Ref151050
24/12/11Ref4407280
  • En choisissant les colonnes clé Date, Produit et l'option Tout dédoublonner, seules les premières valeurs trouvées pour la clé sont conservées. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
DateProduitPrix unitaireQuantitéPrix total
24/12/2011Ref1520100
24/12/2011Ref23211352
24/12/2011Ref31214168
24/12/2011Ref44023920
24/12/2011Ref510660
24/12/2011Ref6186108
24/12/2011Robe10330
  • En choisissant les colonnes clé Date, Produit et l'option Dédoublonner toutes les lignes sauf celle de la même source, seuls les doublons provenant d'un même source sont conservés. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
DateProduitPrix unitaireQuantitéPrix total
24/12/2011Ref1530150
24/12/2011Ref232351120
24/12/2011Ref31229348
24/12/2011Ref440301200
24/12/2011Ref510660
24/12/2011Ref6186108
24/12/2011Robe10330
  • En choisissant la clé Date, Produit et l'option Dédoublonner toutes les lignes sauf celle de la première source de données, seuls les doublons de la première source sont conservés. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
DateProduitPrix unitaireQuantitéPrix total
24/12/2011Ref1520100
24/12/2011Ref232351120
24/12/2011Ref31229348
24/12/2011Ref44023920
24/12/2011Ref510660
24/12/2011Ref6186108
24/12/2011Robe33010
  • Sélectionnez Associer les colonnes clés pour créer des associations entre une ou plusieurs colonnes de dimensions « clés » de sources différentes

    Exemple :

    L'utilisateur a deux sources de données.

    La première Source 1 affiche le montant par projet et client :

    Screenshot-68.png

    La seconde Source 2 affiche le temps passé par projet pour chaque employé :

    1593432709099-709.png

    On souhaite afficher le temps consacré pour chaque client ainsi que le montant facturé. Si l'on utilise une union simple, le résultat est le suivant :

    1593432737453-934.png

    Si l'on utilise une union associative avec la clé Projet, on obtient le résultat suivant :

    1593432754577-566.png

    Pour chaque client, on établit la liste des projets. La clé sur Projet permet ensuite de déterminer le temps passé sur chacun d'eux.
    Par exemple, Nasa a 2 projets Fusée et Navette. Sur Fusée, le temps passé est de 40 (10 par John et 30 par Henri) et sur Navette le temps passé est de 20. Le total est donc de 60.