Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Prochaine révision
Révision précédente
enseignement:xml:introxquery [2013/11/04 23:20] – créée Emmanuel Brunoenseignement:xml:introxquery [2023/09/20 18:52] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
-====== Introduction à XML/XQuery ====== +====== Intro. XML/XQuery (Ingemedia) ====== 
- +L'objectif de ce TD est de découvrir XQuery, il ne s'agit que d'une introduction mais à l'issue de ces quelques exercices l'interrogation avancées de documents XML (ou JSON) sera déjà possible. Des supports de cours se trouvent dans la partie Enseignement/Intranet après connexion avec vos identifiants de l'UTLN, ils ne sont pas nécessaire pour suivre ce TD.
-Les supports de cours se trouvent dans la partie Enseignement/Intranet après connexion avec vos identifiants de l'UTV.+
  
 ===== Etude pratique d'un document XML ===== ===== Etude pratique d'un document XML =====
-Pour cette partie pratique le document exemple du livre "XQuery pour interroger des données XML" sera utilisé : {{:enseignement:xml:queyras.xml|queryas.xml}}+Pour cette partie pratique le document exemple du livre "XQuery pour interroger des données XML" sera utilisé : {{:enseignement:xml:queyras.xml|queyras.xml}}
  
 <note>Regarder ce document, et décrire sa structure générale sous la forme d'un arbre. Cela facilitera ensuite l'interrogation</note> <note>Regarder ce document, et décrire sa structure générale sous la forme d'un arbre. Cela facilitera ensuite l'interrogation</note>
  
 ===== Première approche de XQuery ===== ===== Première approche de XQuery =====
-Pour cette première approche de XQuery, nous allons utiliser l'interprète zorba (http://www.zorba.io/). Pour pouvoir l'utiliser il faut : +<note> 
-  ouvrir un terminal, créer un répertoire de travail et se placer dedans. Par exemple, le répertoire XML à la racine de votre compte (''mkdir XML'' puis ''cd XML''). +En TP, nous utiliserons eXist-db, une base de données XML https://exist.lsis.univ-tln.fr/exist/apps/eXide/index.html 
-  télécharger le document exemple {{:enseignement:xml:queyras.xml|queryas.xml}} dans le répertoire précédent. + 
-  lancer un éditeur de texte (par exemple gedit) pour écrire les requêtes en les enregistrant dans des fichiers textes en précisant l'extension habituelle ''.xq''+Un login et un password vous seront donnés en cours. Vous pouvez vous en servir pour éditer des documents et des requêtes. Il est aussi possible de les sauvegarder après vous être connecté.  
-  A partir du terminal lancer l'exécution de la requête (ici dans le fichier ''q1.xquery'')+</note> 
 + 
 +/* 
 +Pour cette première approche de XQuery, nous allons utiliser l'interprète zorba (http://www.zorba.io/). Zorba supporte la dernière version de XQuery et peut même l'appliquer à du JSON. Il peut être utilisé depuis des langages comme Java ou PHP. 
 + 
 +Pour pouvoir l'utiliser il faut : 
 +  ouvrir un terminal, créer un répertoire de travail et se placer dedans. Par exemple, le répertoire XML à la racine de votre compte (''mkdir XML'' puis ''cd XML''). 
 +  télécharger le document exemple {{:enseignement:xml:queyras.xml|queyras.xml}} dans le répertoire précédent. 
 +  lancer un éditeur de texte (par exemple gedit) pour écrire les requêtes en les enregistrant dans des fichiers textes en précisant l'extension habituelle ''.xq''
 +  A partir du terminal lancer l'exécution de la requête (ici dans le fichier ''q1.xq'')
  
     zorba -i -f -q q1.xq     zorba -i -f -q q1.xq
Ligne 20: Ligne 28:
 nom local ''q1.xq'' est le paramètre de l’option ''-q''. L’option ''-i'' indique que le résultat nom local ''q1.xq'' est le paramètre de l’option ''-q''. L’option ''-i'' indique que le résultat
 doit être indenté. doit être indenté.
- +*/ 
 ==== Les expressions simples ==== ==== Les expressions simples ====
 Les expressions XQuery les plus simples des valeurs littérales : Les expressions XQuery les plus simples des valeurs littérales :
Ligne 29: Ligne 37:
 Il est aussi possible d'évaluer des expressions arithmétiques avec les opérateurs classique (à part le ''/'' pour la division qui est remplacé par ''div'').    Il est aussi possible d'évaluer des expressions arithmétiques avec les opérateurs classique (à part le ''/'' pour la division qui est remplacé par ''div'').   
  
-<Note>Ecrivez quelques requêtes simples utilisant des littéraux et des expressions arithmétiques</Note>+<note>Ecrivez quelques requêtes simples utilisant des littéraux et des expressions arithmétiques</note> 
 + 
 +Un document XML est aussi une expression qui a comme valeur ce document. Il est possible d'indiquer qu'une fragment de document est une expression XQuery en la mettant entre { et } 
 +  * ''<a>1<b>2</b></a>'' 
 +  * ''<a x='{1+2}'>{3*4}</a>'' 
 + 
 +<note>Ecrivez une requête qui fabrique un document XML simple</note>
  
 ==== Séquences ==== ==== Séquences ====
-XQuery ne manipule que des séquences (une liste ordonnée) d'items (des littéraux ou des noeuds XML). L'évaluation d'une requête retourne une séquence. Il est possible de créer des séquences avec les opérateurs ''()'' et '',''+XQuery ne manipule que des séquences plate (une liste ordonnée) d'items (des littéraux ou des noeuds XML). L'évaluation d'une requête retourne une séquence. Il est possible de créer des séquences avec les opérateurs ''()'' et '',''http://lsis.univ-tln.fr/~bruno/enseignement/xml/xml
  
 Quelques exemples : ''()'' ''(1,2,"a",<a><b/></a>)''  Quelques exemples : ''()'' ''(1,2,"a",<a><b/></a>)'' 
 +
 +<Note>Que se passe-t-il si l'on imbrique deux séquences ?</Note>
  
 ==== Variables ==== ==== Variables ====
Ligne 43: Ligne 59:
 return $x + $y return $x + $y
 </code> </code>
 +
 +<Note>Modifier votre requête qui crée un document XML pour qu'elle utilise des variables</Note>
  
 ==== Bibliothèque de fonctions ==== ==== Bibliothèque de fonctions ====
Ligne 58: Ligne 76:
 Si aucun axe n'est précisé c'est l'axe ''child'' qui est utilisé. Si aucun axe n'est précisé c'est l'axe ''child'' qui est utilisé.
  
-<note warning> Attention, comme le document XML utilise un espace de nom. Il faut le déclarer en ajoutant avant chaque requête : ''declare default element namespace "http://mes-guides-randos";''+<note warning> Attention, comme le document XML utilise un espace de nom. Il faut le déclarer (ici par défaut) en ajoutant avant chaque requête :  
 + 
 +<code>declare default element namespace "http://mes-guides-randos";</code>
 </note> </note>
  
 Quelques exemples : Quelques exemples :
-  * fn:doc("queyras.xml")/descendant::secteur +  * ''fn:doc("http://bruno.lsis.univ-tln.fr/_media/enseignement/xml/queyras.xml")/descendant::secteur'' 
-  * fn:doc("queyras.xml")/descendant::itinéraire +  * ''fn:doc("http://bruno.lsis.univ-tln.fr/_media/enseignement/xml/queyras.xml")/descendant::itinéraire'' 
-  * fn:doc("queyras.xml")/descendant::itinéraire/nom/text() +  * ''fn:doc("http://bruno.lsis.univ-tln.fr/_media/enseignement/xml/queyras.xml")/descendant::itinéraire/nom/text()'' 
-  * fn:doc("queyras.xml")/child::guide/child::secteur/child::nom +  * ''fn:doc("http://bruno.lsis.univ-tln.fr/_media/enseignement/xml/queyras.xml")/child::guide/child::secteur/child::nom''
-  * fn:doc("queyras.xml")/guide/secteur/nom+
      
-<Note>Tester les exemples précédents. Trouver (i) tous les paragraphes et (ii) toutes les altitudes. </Note>  +Il est aussi possible de copier le document XML exemple dans exist et d'utiliser un chemin local/ 
 +  * ''fn:doc("/db/ingemedia/queyras.xml")/guide/secteur/nom'' 
 + 
 +   
 +<Note>Tester les exemples précédents. Trouver (i) tous les paragraphes et (ii) toutes les altitudes. Mettez ces résultats dans un élément XML ''Résultat'' </Note>  
  
 === Les axes === === Les axes ===
-  – l’axe self qui contient le nœud contexte ; +  l’axe self qui contient le nœud contexte ; 
-  – l’axe child qui contient les enfants du nœud contexte ; +  l’axe child qui contient les enfants du nœud contexte ; 
-  – l’axe descendant qui contient les descendants du nœud contexte, c.-à-d. les enfants +  l’axe descendant qui contient les descendants du nœud contexte, c.-à-d. les enfants du nœud contexte et leurs descendants ; 
-du nœud contexte et leurs descendants ; +  l’axe descendant-or-self qui contient le nœud contexte et ses descendants ; 
-  – l’axe descendant-or-self qui contient le nœud contexte et ses descendants ; +  l’axe parent qui contient le parent du nœud contexte ; 
-  – l’axe parent qui contient le parent du nœud contexte ; +  l’axe ancestor qui contient les ancêtres du nœud contexte ; 
-  – l’axe ancestor qui contient les ancêtres du nœud contexte ; +  l’axe ancestor-or-self qui contient le nœud contexte et ses ancêtres ; 
-  – l’axe ancestor-or-self qui contient le nœud contexte et ses ancêtres ; +  l’axe preceding-sibling qui contient les frères et sœurs du nœud contexte qui apparaissent avant le nœud contexte dans l’ordre du document mais qui est vide si le nœud contexte est un nœud attribut ; 
-  – l’axe preceding-sibling qui contient les frères et sœurs du nœud contexte qui apparaissent avant le nœud contexte dans l’ordre du document mais qui est vide si le nœud +  l’axe following-sibling qui contient les frères et sœurs du nœud contexte qui apparaissent après le nœud contexte dans l’ordre du document mais qui est vide si le nœud contexte est un nœud attribut ; 
-contexte est un nœud attribut ; +  l’axe preceding qui contient les descendants de la racine de l’arbre auquel appartient le nœud contexte qui apparaissent avant le nœud contexte dans l’ordre du document, excepté les ancêtres du nœud contexte ; 
-  – l’axe following-sibling qui contient les frères et sœurs du nœud contexte qui apparaissent après le nœud contexte dans l’ordre du document mais qui est vide si le nœud +  l’axe following qui contient les descendants de la racine de l’arbre auquel appartient le nœud contexte qui apparaissent après le nœud contexte dans l’ordre du document, excepté les descendants du nœud contexte ; 
-contexte est un nœud attribut ; +  l’axe attribute qui contient les nœuds attribut dont le parent est le nœud contexte. 
-  – l’axe preceding qui contient les descendants de la racine de l’arbre auquel appartient + 
-le nœud contexte qui apparaissent avant le nœud contexte dans l’ordre du document, +=== Les test de noeuds === 
-excepté les ancêtres du nœud contexte ; +Dans le cadre de cette première approche un test de nœud sera soit un test sur le nom du nœud (on donne le nom des éléments ou des attributs à conserver en fonction de l'axe), soit un test sur la sorte (node(), element(), text(), ...)
-  – l’axe following qui contient les descendants de la racine de l’arbre auquel appartient +
-le nœud contexte qui apparaissent après le nœud contexte dans l’ordre du document, +
-excepté les descendants du nœud contexte ; +
-  – l’axe attribute qui contient les nœuds attribut dont le parent est le nœud contexte.+
  
 ==== Comparaison ==== ==== Comparaison ====
 Il y a trois types d'opérateurs de comparaisons Il y a trois types d'opérateurs de comparaisons
-– les opérateurs de comparaison de valeurs qui sont les opérateurs classiques qui comparent des valeurs atomiques de façon stricte (''eq'', ''ne'', ''lt'', ''le'', ''gt'' et ''ge'') ; +  * les opérateurs de comparaison de valeurs qui sont les opérateurs classiques qui comparent des valeurs atomiques de façon stricte (''eq'', ''ne'', ''lt'', ''le'', ''gt'' et ''ge'') ; 
-– les opérateurs de comparaison générale qui comparent des valeurs de façon plus flexible,+  les opérateurs de comparaison générale qui comparent des valeurs de façon plus flexible,
 par exemple, deux séquences seront considérées comme égales si l’une contient un par exemple, deux séquences seront considérées comme égales si l’une contient un
 item égal à un item contenu dans l’autre ; (''='', ''!='', ''<'', ...) item égal à un item contenu dans l’autre ; (''='', ''!='', ''<'', ...)
-– les opérateurs de comparaison de nœuds qui comparent des nœuds par rapport à leur+  * les opérateurs de comparaison de nœuds qui comparent des nœuds par rapport à leur
 identité où à leur rang dans l’ordre du document ('' is '' même noeud, ''<<'' avant et ''>>'' après). identité où à leur rang dans l’ordre du document ('' is '' même noeud, ''<<'' avant et ''>>'' après).
 +
 +  * ''3 eq 4''
 +  * ''"a" eq "b"''
 +  * ("a","b") = ("b")
 +  * ''fn:doc("queyras.xml")/guide/secteur/nom = "Secteur de la Durance"''
 +  <code>let $doc:=fn:doc("queyras.xml")/guide 
 +    return $doc/éditeur >> $doc/auteur and $doc/année << $doc/titre</code>
 + 
 +<Note>Expliquer et tester les comparaisons précédentes</Note>
 +
 +==== le FLWOR ====
 +FLWOR (http://www.w3.org/TR/xquery/#id-flwor-expressions), qui se prononce ”flower”, est un acronyme pour for-let-where-order by-return. L’expression FLWOR est à XQuery ce que l’expression select-from-where-order by est
 +à SQL.
 +
 +En n'utilisant que les clauses ''for'' et ''return'', on peut le voir comme une sorte de boucle sur les séquences. 
 +<code>
 +for $i in fn:doc("queyras.xml")//itinéraire
 +return $i/nom
 +</code>
 +
 +L'utilisation de la clause ''let'' permet de définir des variables utilisables dans les clauses suivantes.
 +<code>
 +for $i in fn:doc("queyras.xml")//itinéraire
 +let $a := $i/alt
 +return <iti nom="{$i/nom}" alt="{$a}"/>
 +</code>
 +
 +L'utilisation de la clause ''where'' permet de filtrer les résultats
 +<code>
 +for $i in fn:doc("queyras.xml")//itinéraire
 +let $a := $i/alt
 +where $i/../nom = "Secteur de Ceillac"
 +return <iti nom="{$i/nom}" alt="{$a}"/>
 +</code>
 +
 +La clause ''order by'' permet d'indiquer quel est le critère de tri.
 +<code>
 +for $i in fn:doc("queyras.xml")//itinéraire
 +let $a := $i/alt
 +where $i/../nom = "Secteur de Ceillac"
 +order by $a
 +return <iti nom="{$i/nom}" alt="{$a}"/>
 +</code>
 +
 +Il est bien sur possible de les "imbriquer" 
 +<code>
 +for $s in fn:doc("queyras.xml")//secteur
 +for $i in $s/itinéraire
 +order by $s/nom, $i/nom
 +return <iti-sec iti="{$i/nom}" sec="{$s/nom}"/>
 +</code>
 +
 +==== A vous de jouer ====
 +Après cette présentation très rapide de XQuery vous pouvez maintenant écrire vos propres requêtes pour répondre aux questions suivantes :
 +
 +  * La liste des noms d'itinéraires triés par cotation
 +  * La liste des secteurs comportant un itinéraire dont l’altitude d’arrivée est supérieurs à 3000 m.
 +  * La liste des itinéraires comportant une note de prudence
 +  * Une liste d'éléments XML qui présente pour chaque secteur la moyenne des altitudes des itinéraires
 + 
 +==== Pour aller plus loin ====
 +  * La production de document XHTML est immédiate : proposez une présentation XHTML du résultat de l'une des requêtes (en réalité, il possible d'associer du CSS directement à un document XML).
 +  * Il est aussi possible de produire de nombre autre formats par simple transformation : des images vectorielles (SVG), des documents bureautique (opendocument), ...  
 +
 +==== Pour préparer le dernier TD ====
 +Ce travail est à rendre par groupes de 3 maximum le 28/11/2014.
 +
 +  * Trouver une source de documents XML (http://data.nantes.fr ou https://www.data.gouv.fr) pertinente. 
 +  * Présenter son intérêt dans le cadre de la réutilisation de données et donner une idée d'application
 +  * Ecrire des requêtes XQuery pour réaliser la réutilisation :
 +    * Extraire des données
 +    * Reconstruire de nouvelles données
 +  * En option vous pouvez construire des données dans un format standard :
 +    * produire un document XHTML (par exemple un tableau de présentation des données)
 +    * produire une image SVG (Un histogramme, ....)
 +
 +~~DISCUSSION~~
 +
 +---- dataentry page ----
 +type                 : Enseignement
 +level                : main
 +enseignement_tags    : Ingemedia
 +promotion            : Infocom
 +technologies_tags    : XMLM,XQuery,Zorba
 +----
 +
 +
 ---- struct data ---- ---- struct data ----
 +metadata.level       : 
 +metadata.Type        : 
 +metadata.Nom         : 
 +metadata.Enseignements : 
 +metadata.Promotions 
 +metadata.Technologies : 
 +metadata.Thèmes     : 
 +metadata.Description : 
 ---- ----