Effectuer une union de données

Last modified by Aurelie Bertrand on 2025/02/12 11:41

Il est possible d'unir les données de plusieurs modèles de données.

💡 L'union associative (option Associer les colonnes clés) devrait être la dernière opération de transformation. Toute opération après l'union associative ne conserve pas les propriétés d'associativités. Ainsi, l'union associative ne doit pas être utilisée sur un modèle intermédiaire.

Effectuer une union de données

La combinaison des données se fait de manière verticale. Les données sont agrégées sous chaque colonne.

  1. Dans la boite Création d'un nouveau modèle de données, cliquez sur le bouton Union de la section Autres.
    Union
    ➡ La boîte de dialogue Union s'affiche.
     
  2. Sélectionnez les modèles de données que vous souhaitez utiliser en cliquant sur le bouton Ajouter puis en choisissant Existant (ou Nouveau pour créer un nouveau modèle de données.)
    1737123440951-952.png

    Les dimensions et les mesures des modèles sélectionnés sont agrégées en fonction de leur nom et de leur type. Si un objet porte le même nom et a le même type dans les différents modèles, on considère ainsi qu'il s'agit du même objet (il n'apparaîtra donc qu'une fois dans le modèle de données agrégé).
     
  3. Sélectionnez la manière dont vous souhaitez gérer les doublons dans la liste déroulante :
    • Pas d'exclusion : il s'agit de la valeur par défaut. Les doublons figurant dans les modèles de données sont conservés.
    • Tout dédoublonner : Cochez les dimensions qui seront utilisées comme clé pour déterminer les doublons. Seule la première valeur de clé trouvée est conservée. Les doublons (quelle que soit le modèle de données) sont tous éliminés.
    • Dédoublonner toutes les lignes sauf celle de la première source de données : Cochez les dimensions qui seront utilisées comme clé pour déterminer les doublons. Les doublons de la première source de données sont conservés, ceux trouvés dans les sources de données suivantes sont supprimés.
    • Dédoublonner toutes les lignes sauf celle de la même source de données: Cochez les dimensions qui seront utilisées comme clé pour déterminer les doublons. Les doublons figurant dans la même source de données sont conservés, ceux trouvés dans les sources de données suivantes sont supprimés.
       
  4. Alternativement, sélectionnez Associer les colonnes clés pour créer des associations entre une ou plusieurs colonnes de dimensions « clés » de sources différentes. 

➡ Les colonnes clés identifiées par le logiciel s'affichent dans la table Colonnes clés (hormis pour l'option Pas d'exclusion). Cochez la ou les dimension(s) clé(s) sur laquelle ou lesquelles sera effectuée l'union. Les dimensions clés doivent exister dans tous les modèles sélectionnés.

Union_FR.png

💡 Dans le cas où les dimensions ont des identifiants différents dans les modèles de données, il est possible créer une clé de jointure en cliquant sur le bouton Ajouter une clé.

Union_add_key_dialog_FR.png

Exemples de création d'une union entre deux tables

Exemples de dédoublonnement

L'utilisateur souhaite réaliser une union entre deux modèles de données : Ventes1 basé sur le fichier Ventes1.xls et Ventes2 basé sur le fichier excel Ventes2.xls.

Fichier Ventes1.xls :

Ventes1

Fichier Ventes2.xls :

1739279301558-311.png
 

  • En choisissant les colonnes clé Date, Produit et l'option Tout dédoublonner, seules les premières valeurs trouvées pour la clé sont conservées. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
    Tout dédoublonner
     
  • En choisissant les colonnes clé Date, Produit et l'option Dédoublonner toutes les lignes sauf celle de la même source, seuls les doublons provenant d'une même source sont conservés. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
    Dédoublonner toutes les lignes sauf celle de la même source
     
  • En choisissant la clé Date, Produit et l'option Dédoublonner toutes les lignes sauf celle de la première source de données, seuls les doublons de la première source sont conservés. Si vous créez un tableau basé sur ce nouveau modèle de données, vous obtiendrez alors le résultat suivant :
    Dédoublonner toutes les lignes sauf celle de la première source de données

Exemple d'union associative

L'utilisateur a deux sources de données.

La première Source 1 affiche le montant par projet et client :

Source 1

La seconde Source 2 affiche le temps passé par projet pour chaque employé :

1739282629552-745.png

On souhaite afficher le temps consacré pour chaque client ainsi que le montant facturé. Si l'on utilise une union simple, le résultat est le suivant :

Union simple

Si l'on utilise une union associative avec la clé Projet, on obtient le résultat suivant :

1739271685152-708.png

Pour chaque client, on établit la liste des projets. La clé sur Projet permet ensuite de déterminer le temps passé sur chacun d'eux.
Par exemple, Nasa a 2 projets Fusée et Navette. Sur Fusée, le temps passé est de 40 (10 par John et 30 par Henri) et sur Navette le temps passé est de 20. Le total est donc de 60.