Description du service Transformer un fichier SKOS/RDF-XML en fichier CSV dont le séparateur est une virgule
Les fichiers contenant des "skos:Concept" ou des "rdf:Description" de type "Concept" sont traités par ce service.
Ce service permet de générer un fichier CSV à partir d'un fichier SKOS/RDF-XML valide. Le fichier produit peut être importé dans un tableur (Excel, LibreOffice, etc.) pour y être modifié (voir plus loin la procédure d'import dans Excel).
Les données sont transformées de la manière suivante :
- Une première ligne "en-têtes de colonnes" est créée à partir des éléments (propriétés skos ou autres) utilisés pour décrire les différents concepts du fichier RDF-XML :
- Une étiquette "ID" est créée pour les identifiants des concepts.
- Les propriétés ayant un attribut "xml:lang" sont listées en acollant le nom de l'élément (sans espace de nom) avec le code langue (par exemple, "skos:prefLabel/@xml:lang='fr'" donne l'étiquette "prefLabel_fr").
- En ce qui concerne les propriétés qui ont un attribut autre que "xml:lang":
- celles qui corresponsdant aux relations sémantiques ("skos:broader", "skos:narrower" et "skos:related") sont traduites en "broader_fr", "narrower_fr" et "related_fr",
- les autres (propriétés d'alignement, etc.) sont sorties avec le nom de l'élément seulement (sans espace de nom, par exemple, "exactMatch" pour "skos:exactMatch").
- Les propriétés qui n'ont pas d'attribut sont sorties avec le nom de l'élément seulement (sans espace de nom).
- Si le fichier contient des collections, une étiquette "group_fr" est créée. Cette étiquette peut s'avérer redondante si les concepts contiennent des propriétés reflettant leur appartenance à des groupes (domaine, microthésaurus, etc.).
- Ensuite, une ligne est générée pour chaque concept du fichier :
- le contenu de l'attribut "rdf:about" est mis dans la colonne "ID",
- le contenu des éléments textuels (termes, définitions, notes, etc.) est versé dans la colonne correspondant à l'élément et au code langue de cet élément,
- les relations hiérarchiques et associatives (liens) sont traduites en les remplaçant par les termes préférentiels français correspondants,
- le contenu des autres éléments est sorti tel quel,
- si le concept appartient à une collection, le nom en français de la collection est mis dans la colonne "group_fr".
A noter que :
- les contenus des différents champs sont mis entre quotes (guillements anglais) pour éviter les problèmes de séparation quand ces contenus contienent la virgule comme élément de ponctuation,
- si le contenu d'un champ contient des quotes, elles sont doublées pour les protéger,
- les contenus des champs à occurrences multiples (par exemple, "skos:altLabel") sont versés dan la même "cellule" mais séparés par ce séparateur «§§».
Pour importer le fichier dans Excel :
- Créer un nouveau fichier dans Excel ("Fichier" / "Nouveau").
- Cliquer sur Menu "Données", choisir "Fichier texte" puis choisir le fichier à importer avec l'explorateur de fichiers.
- Importer le fichier (bouton "Importer").
- Au niveau de l'Assistant Importtation de texte :
- cocher la case "Délimité",
- dans la liste déroulante de menu "Origine du fichier", choisir "65001 : Unicode (UTF-8)"
- Cliquer sur "Suivant" :
- Au niveau de la colonne "Séparateurs", cocher la case "Virgule",
- Garder les quotes (") au niveau du menu "Identificateur de texte",
- Vérifier le rendu au niveau de l'Aperçu des données,
- Cliquer sur "Terminer".
Le fichier modifié dans Excel et sauvegardé en CSV peut être transformé en SKOS en utilisant le service "Transformer un fichier CSV dont le séparateur est un point-virgule en SKOS-XML" ou "Transformer un fichier CSV dont le séparateur est une virgule en SKOS-XML" en fonction du séparateur de champs appliqué au moment de la sauvegarde.