Code source wiki de Requête en langage naturel

Modifié par jhurst le 2021/04/21 10:01

Afficher les derniers auteurs
1 {{ddtoc/}}
2
3 = Prérequis =
4
5 * Des cubes dans vos portefeuilles récemment rafraîchis
6
7 = Création de flux via des requêtes en langage naturel =
8
9 Digdash offre la possibilité de créer des graphiques en quelques clics via des requêtes en langage naturel.
10
11 * Via l’éditeur de tableau de bord
12
13 |[[image:text_query_fr_html_a7f915e890b18ac9.png||queryString="width=258&height=183" height="183" width="258"]]
14 |**Éditeur de tableaux de bord** > **Création de nouveaux graphiques** > E**n langage naturel**
15 |[[image:text_query_fr_html_a8320d7a08f37973.png||queryString="width=284&height=189" height="189" width="284"]]
16 |Dans la fenêtre qui apparaît, vous pouvez saisir votre requête dans la barre de recherche
17 |[[image:text_query_fr_html_40713eb3535f7aa4.png||queryString="width=323&height=211" height="211" width="323"]]
18 |Choisir un graphe dans la liste de résultats présentée (nous allons choisir le premier résultat)
19 |[[image:text_query_fr_html_54d00d5426e9da23.png||queryString="width=333&height=165" height="165" width="333"]]
20 |Et enregistrer dans le portefeuille courant le graphe choisi.
21 |[[image:text_query_fr_html_a2e6123cb377f8d5.png||queryString="width=303&height=199" height="199" width="303"]]
22 |Donner un nom à votre flux à créer
23 |[[image:text_query_fr_html_ec2aa8b478645502.png||queryString="width=355&height=198" height="198" width="355"]]
24 |Le nouveau flux sera rajouté à votre éditeur de tableau de bord et vous trouverez bien le flux fraîchement créé dans la liste des flux
25
26 * Via le tableau de bord
27
28 Il est également possible de rajouter dans votre tableau de bord final un élément « Requête sur les données » pour pouvoir produire des flux à la volée.
29
30 |[[image:text_query_fr_html_593b9623abdb5a4a.png||queryString="width=233&height=455" height="455" width="233"]]
31 |**Éditeur de tableaux de bord **> **Contenu statique** > **Éléments** > **Requête sur les données**
32 |[[image:text_query_fr_html_22fbbc87dea1438d.png||queryString="width=325&height=249" height="249" width="325"]]
33 |Ajouter l’élément sur votre éditeur de tableau de bord
34 |[[image:text_query_fr_html_24adf3840e398ced.png||queryString="width=300&height=175" height="175" width="300"]]
35 |(((
36 Il se peut lors de vos requêtes que vous filtriez sur les membres d’une dimension ou d’une mesure.
37
38 Il est donc conseillé de se munir de l’élément « Éléments filtrés » sur le tableau de bord pour les supprimer pour les prochaines requêtes.
39
40 **Éditeur de tableaux de bord** > **Contenu statique** > **Éléments** > **Éléments filtrés**
41 )))
42 |[[image:text_query_fr_html_274f0444542aba9f.png||queryString="width=325&height=127" height="127" width="325"]]
43 |Vous retrouverez ensuite ces éléments du côté de votre tableau de bord
44
45 {{{
46 }}}
47
48 = Formation d’une requête en langage naturel =
49
50 Digdash vous permet de créer des graphes à partir de modèles de données en langage naturel.
51
52 Digdash se repose principalement sur des mots-clés pour vous proposer les graphiques les plus pertinents ainsi que sur les noms des colonnes de vos modèles de données.
53
54 Une requête sera ainsi basiquement formée de noms de mesures de votre modèle et/ou de noms de dimensions, suivi ou pas de noms de graphiques et/ou d’opérations de tri.
55
56 Nous verrons dans la suite de ce document à quel point le choix des termes d’une requête est important.
57
58 = Résultats d’une requête =
59
60 [[image:text_query_fr_html_dee11487843abaf5.png||queryString="width=550&height=124" height="124" width="550"]]
61
62
63 //__Capture : Présentation des résultats d’une requête en langage naturel__//
64
65
66 Les résultats d’une requête vous proposent une liste de graphes classés par pertinence avec un score associé. Plus ce score est grand, plus le graphe associé est considéré comme pertinent. Aussi, le nom du cube associé est mentionné ainsi qu’une description du graphe.
67
68 Nous verrons dans la suite de ce document quels sont les critères qui influent sur le calcul du score d’un résultat de requête.
69
70 = Choix des graphiques =
71
72 Pour une requête donnée, il vous sera proposé une liste de résultats de différents graphes, dépendants du contenu de la requête.
73
74 Il est toutefois possible d’exiger un type de graphe en particulier, dans la mesure où cela reste cohérent (la requête « Coût de communication en courbe » n’est pas cohérente).
75
76 Le nombre de membres dans les résultats d’une requête a également une incidence. En effet, dans le cas d’une requête cohérente mais avec un nombre de résultats trop important, il vous sera proposé un graphe adapté au nombre de résultats à afficher.
77
78 Voici les mots-clés à utiliser pour le choix des graphes :
79
80 |**Nom des graphiques**|**Mots-clés**
81 |Diagramme en secteurs|« secteur »
82 « camembert »
83 « ratio »
84 |Jauge|« jauge »
85 |Barre de progression|« barre de progression »
86 |Barres d’énergie|(((
87 « energie »
88
89 « consommation »
90 )))
91 |Indicateur flèche|« fleche »
92 |Diagramme en colonnes|(((
93 « colonne »
94
95 « histogramme »
96 )))
97 |Diagramme en barres|« barre »
98 |Carte|« carte »
99 |Diagramme scatter|(((
100 « dispersion »
101
102 « correlation »
103 )))
104 |Diagramme à bulles|« bulle »
105 |Diagramme en ligne|(((
106 « ligne »
107
108 « courbe »
109 )))
110 |Diagramme de surfaces|(((
111 « zone »
112
113 « surface »
114 )))
115 |Diagramme radar|« radar »
116 |Tableau|(((
117 « tableau »
118
119 « Table »
120 )))
121 |Indicateur|« indicateur »
122 |Tableau croisé|« tableau croisé »
123 |Tableau OLAP|(((
124 « OLAP »
125
126 « tableau OLAP »
127 )))
128 |Texte|« texte »
129
130 //__Tableau des mots-clés pour le choix d’un graphe__//
131
132 = Tri =
133
134 Il vous est possible d’effectuer des opérations de tri dans vos requêtes via les mots-clés suivants :
135
136 |**Tri**|**Mots-clés**|**Exemples de requêtes**
137 |Croissant|(((
138 « trie » (croissant)
139
140 « triee » (croissant)
141
142 « ordonne » (croissant)
143
144 « ordonnee » (croissant)
145
146 « tri » (croissant)
147
148 « ordre » (croissant)
149
150 « croissant »
151 )))|(((
152 « Coûts par région en France en 2006 triés par coût en tableau »
153
154 « Coûts par région en France en 2006 triés en tableau »
155
156 « Coûts par région en France en 2006 croissants en tableau »
157
158 « Coûts par région en France en 2006 triés croissants en tableau »
159 )))
160 |Décroissant|(((
161 « trie » (décroissant)
162
163 « triee » (décroissant)
164
165 « ordonne » (décroissant)
166
167 « ordonnee » (décroissant)
168
169 « tri » (décroissant)
170
171 « ordre » (décroissant)
172
173 « décroissant »
174 )))|(((
175 « Coûts par région en France en 2006 triés décroissant par coût en tableau »
176
177 « Coûts par région en France en 2006 décroissants en tableau »
178
179 « Coûts par région en 2006 triés en décroissant en tableau »
180 )))
181
182 //__Tableau des mots-clés pour le tri__//
183
184
185 = Tendance d’une mesure =
186
187 Une mesure a une tendance. Elle peut être stable (tendance par défaut), croissante ou décroissante :
188
189 {{{
190 }}}
191
192 |**Tendance**|**Signification**
193 |STABLE|Tendance par défaut : Le plus grand est le meilleur
194 |CROISSANTE|(((
195 Le plus grand est le meilleur
196
197 //Exemple : pour une marge//
198 )))
199 |DÉCROISSANTE|(((
200 Le plus petit est le meilleur
201
202 //Exemple : pour un coût//
203 )))
204
205 __//Tableau des tendances possibles pour une mesure//__
206
207
208
209 Vous pouvez éditer la tendance d’une mesure via le Studio Digdash, dans la configuration avancée d’une source de données, dans les propriétés de la mesure.
210
211
212 //__Définition d’une tendance pour une mesure dans le Studio Digdash__//
213
214
215 * Impact de la tendance sur le tri
216
217 La tendance a un impact sur le tri. En effet, si le type de tri (croissant ou décroissant) n’est pas explicitement mentionné, celui-ci se basera sur la tendance de la mesure sur laquelle le tri s’effectue. On obtiendra par conséquent un tri décroissant sur une mesure de tendance stable ou croissante et un tri croissant dans le cas d’une mesure de tendance décroissante.
218
219
220
221 |**Tendance**|**Exemples de requêtes**|**Tri obtenu**
222 |STABLE|(((
223 « CA par région trié »
224
225 CA est une mesure à tendance stable
226 )))|//Le tri de la mesure CA sur la dimension région sera décroissant//
227 |CROISSANTE|(((
228 « Marge par région triée »
229
230 Marge est une mesure à tendance croissante
231 )))|//Le tri de la mesure Marge sur la dimension région sera décroissant//
232 |DÉCROISSANTE|(((
233 « Coût par région trié »
234
235 Coût est une mesure à tendance décroissante
236 )))|//Le tri de la mesure Coût sur la dimension région sera croissant//
237
238 //__Tableau d’exemples de l’impact de la tendance d’une mesure sur le tri__//
239
240 {{{
241 }}}
242
243 = Le(s) pire(s) / le(s) meilleur(s) =
244
245 Il est possible de connaître les X meilleurs/pires membres des résultats de votre requête en utilisant les mots-clés suivants :
246
247 |**Cas**|**Mots-clés**|**Exemple**
248 |Les X meilleurs|(((
249 « Top »
250
251 « meilleur »
252
253 « plus grand »
254
255 « plus important »
256 )))|(((
257 Le meilleur coût en France
258
259 Les 5 meilleures marges en 2016
260
261 Les 2 plus grands CA en Europe
262
263 Top 3 des coûts en France en 2016
264 )))
265 |Les X pires|(((
266 « Pire »
267
268 « moins bon »
269
270 « plus mauvais »
271
272 « plus petit »
273 )))|(((
274 Le pire coût en France
275
276 Les 5 pires marges en 2016
277
278 Les 2 plus mauvais CA en Europe
279 )))
280
281 //__Tableau des mots-clés pour le meilleur et pour le pire__//
282
283
284 = Méthodes d’agrégation =
285
286 Vous avez la possibilité de définir une fonction d’agrégation pour les mesures de votre requête en spécifiant les mots-clés suivants :
287
288 |**Agrégation**|**Mots-clés**|**Exemples de requêtes**
289 |Somme|« somme »|« Somme du coût de communication »
290 |Moyenne|« moyenne »|« Moyenne du coût de communication »
291 |Minimum|« min »|« Min du coût de communication »
292 |Maximum|« max »|« Max du coût de communication »
293
294 //__Tableau des mots-clés pour les méthodes d’agrégation__//
295
296
297 = Objectifs =
298
299 Il est possible d’appliquer des objectifs sur des mesures en mentionnant dans la requête le mot-clé suivant :
300
301
302 |**Mots-clés**
303 |« objectif »
304
305 __//Tableau des mots-clés pour les objectifs//__
306
307
308 Vous pouvez également mentionner directement le nom des objectifs que vous voulez appliquer
309
310
311 |**Exemple**
312 |Soit un modèle de données avec les colonnes suivantes(((
313 |**Dimensions**|**Mesures**
314 |Date|Qualité de communication
315 |Type de ligne|Coût de communication (avec objectif « Obj »)
316 )))
317 |(((
318 Exemple 1 : « Coût de communication en jauge avec objectif »
319
320 * Tous les objectifs de toutes les mesures sont appliqués (un seul objectif par mesure).
321
322 Exemple 2 : « Coût de communication en jauge avec Obj »
323
324 * L’objectif « Obj » est appliqué sur la mesure associée « Coût de communication ».
325 )))
326
327 __//Tableau présentant des exemples d’utilisation des objectifs dans une requête//__
328
329
330 = Utilisation des synonymes =
331
332 La recherche en langage naturel prend en charge les synonymes des termes de vos requêtes.
333
334 == Création des dictionnaires des synonymes ==
335
336 Pour utiliser des termes synonymes dans vos requêtes, vous devez dans un premier temps importer un dictionnaire des synonymes dans Digdash.
337
338 Consulter la documentation « [[synonyms_dictionary>>doc:Digdash.user_guide.information_flow.synonyms_dictionary.WebHome]] » pour importer un dictionnaire des synonymes dans Digdash.
339
340 == Activation des dictionnaires des synonymes ==
341
342 Vous devez ensuite vous assurer que l’utilisation des dictionnaires des synonymes est bien activée pour la fonctionnalité « Requête en langage naturel » dans la configuration serveur.
343 \\[[image:index-configuration.png]]
344
345
346 [[image:configuration-serversettings.png]]
347
348 Arrivé sur la page de la configuration des serveurs, Dans le menu à gauche > **Paramètres supplémentaires... >> **> sous-menu « **Dictionnaires des synonymes **» > Case **Utiliser les dictionnaires des synonymes pour les requêtes en langage naturel**
349
350 [[image:serversettings-synonymsDictionary.png]]
351 //__Capture : Activation de l’utilisation des dictionnaires des synonymes pour les requêtes en langage naturel__//
352
353 == Exemple d’utilisation ==
354
355 |**Exemple**
356 |Soit un modèle de données avec les colonnes suivantes(((
357 |**Dimensions**|**Mesures**
358 |Date|Qualité de communication
359 |Type de ligne|Coût de communication
360 )))
361 |(((
362 Dans ce cas, la requête
363
364 « Prix de communication par genre de ligne »
365
366 est équivalente à la requête
367
368 « Coût de communication par type de ligne »
369
370 (« prix » est un synonyme de « coût » et « genre » est synonyme de « type »).
371
372 (% class="box infomessage" %)
373 (((
374 __**NB**__ : Ceci n’est valable que si votre dictionnaire des synonymes contient ces synonymes.
375 )))
376 )))
377
378 //__Tableau présentant un exemple d’utilisation de termes synonymes dans une requête__//
379
380 = Score des résultats d’une requête =
381
382 Les résultats des requêtes sont triés selon leur pertinence et les meilleurs peuvent atteindre le score de 5.
383
384 Le score pour un résultat d’une requête sera plus ou moins bon selon plusieurs raisons.
385
386 * Importance des termes de la requête
387
388 En effet, un résultat d’une requête sera mieux noté si la requête contient dans ses termes les noms exacts des colonnes de vos modèles de données.
389
390 Une requête sera donc considérée comme moins bonne si elle contient dans ses termes des noms partiels de vos colonnes, ou alors des synonymes des noms des colonnes de votre modèle de données.
391
392 |(% colspan="3" %)**Exemple**
393 |(% colspan="3" %)Soit un modèle de données avec les colonnes suivantes(((
394 |**Dimensions**|**Mesures**
395 |Date|Qualité de communication
396 |Type de ligne|Coût de communication
397 )))
398 |(((
399 **Requête 1 :**
400
401 **Avec des noms exactes**
402 )))|(((
403 **Requête 2 :**
404
405 **Avec des noms partiels**
406 )))|(((
407 **Requête 3 :**
408
409 **Avec des synonymes**
410 )))
411 |« Coût de communication par type de ligne »|« Coût par type »|« Prix par genre de ligne »
412 |Avec seulement des termes exacts dans cette requête, les résultats peuvent être bien notés.|Avec des termes partiaux dans cette requête, les résultats peuvent être moins bien notés.|(((
413 « prix » est synonyme de « coût », « genre de ligne » est synonyme de « type de ligne ».
414
415 Cette requête est différente de la requête d’origine, les notes seront basses.
416 )))
417 |Score* : 5/5|Score* : 3/5|Score* : 2/5
418 |(% colspan="3" %)* les scores présentés n’ont qu’un but démonstratif dans ce document
419
420 //__Tableau pour un exemple présentant l’importance des termes d’une requête__//
421
422 * Importance du type de graphique proposé
423
424 La liste des résultats d’une requête propose des graphes plus ou moins pertinents quant à ce qui est attendu. Compte tenu de la nature des termes de la requête, certains graphes seront moins bien classés que certains, d’où un score moins élevé pour ces derniers.