Descripción del servicio "Transforme un archivo CSV separado por punto y coma en un archivo SKOS-XML"
Este servicio hace posible generar un archivo SKOS-XML a partir de una hoja de cálculo (Excel, LibreOffice, etc.) guardada en CSV y cuyo separador es un punto y coma.
El archivo debe :
- usar los nombres de etiquetas especificados (vea la lista de etiquetas a continuación),
- tener el punto y coma como separador de campo,
- usar este separador "§§" para campos de múltiples valores (ejemplo: hormona§§medicamento),
- usar los comillas dobles (" / quote) como delimitador de texto para los campos que pueden contener el punto y coma para la puntuación, y ponga las comillas al principio y al final del texto para que el punto y coma no se considere como un separador de campo, y si el texto en sí contiene comillas, debe duplicarse.
Si el archivo se genera desde LibreOffice, use el menú "Guardar como" y elija el punto y coma como separador.
Ejemplo de un archivo CSV:
Los datos se transforman de la siguiente manera:
- Se crea un archivo RDF-XML para contener todo el recurso terminologíco.
- Cada línea, excepto la primera, se convierte en "skos:Concept", si hay un identificador presente, se le atribuye al concepto; de lo contrario, se le asigna un uri temporal en el atributo "rdf:about".
- Las etiquetas en la primera línea se convierten a su contraparte de SKOS, por ejemplo, prefLabel_es se convierte en "skos:prefLabel" con un atributo "xml:lang = 'es'".
- El contenido de cada celda se coloca en la propiedad SKOS apropiada. Si el contenido tiene varios valores, se divide en tantas propiedades como valores separados por el separador "§§".
- Las relaciones relacionadas y más amplias se procesan en dos etapas: en primer lugar, se genera una propiedad "skos:related" o "skos:broader" para cada término relacionado o más amplio
luego, en un segundo paso, es el uri del concepto correspondiente a los términos en cuestión que se pone en el atributo "rdf:resource".
- Si el archivo tiene grupos, se creará "skos:Collection" para cada grupo. Asegúrate de traducir los grupos al menos al inglés.
Además, la transformación también inserta dos bloques al principio del archivo RDF-XML:
- Un bloque "cc:License" con la licencia Creative Commons CC-BY 4.0 predeterminada que se debe cambiar si el recurso se libera bajo una licencia diferente.
- Un bloque "skos:ConceptScheme" con:
- una uri derivada de los identificadores de los conceptos ;
- propiedades para metadatos ; para ser completado / modificado por el usuario en el nivel del archivo de salida:
- títulos del recurso en español, inglés y francés (dc:title),
- descripciones del recurso en español, inglés y francés (dc:description),
- sujetos del recurso en español, inglés y francés (dc:subject),
- nombre del creador (dc:creator),
- tipo de licencia (cc:license),
- nombres del recurso en español, inglés y francés de la organización a la que se asignará el recurso.(cc:attributionName),
- sitio web de la organización / institución (cc:attributionURL),
- conceptos cabecera (skos:hasTopConcept) si el recurso está altamente estructurado,
- lenguas del recurso calculadas a partir de los códigos de lengua utilizados para las etiquetas preferente de los conceptos (dcterms:language con lexvo / códigos ISO 639-3 ),
- fecha de creación (dcterms:created),
- fecha de la última modificación (dcterms:modified),
- versión del recurso (owl:versionInfo).
El contenido textual de los campos deberá ser completado y validado por el usuario.
Si los conceptos no tienen identificadores, el uri predeterminado del recurso es "http://www.misitio/vocabs/ABC". También es la raíz del uri de conceptos, relaciones y posibles colecciones.
Debe ser reemplazado de la siguiente manera:
- Sustituir "http://www.misitio/" por el url apropiado.
- Mantener "/vocabs/".
- Sustituir "ABC" por un código alfanumérico corto correspondiente al recurso mismo.
En el nivel de concepto, el uri es una concatenación del uri del recurso con un identificador único; en el nivel de colección, el uri es una concatenación del uri del recurso con el nombre del grupo reemplazando los espacios con "_".
Ejemplo de concepto:
Ejemplos de colecciónes:
Para pasar a identificadores ARK, use la transformación "Asignar identificadores ARK a un archivo SKOS/RDF-XML válido".
Lista de etiquetas que deben utilizarse:
Datos terminológicos |
Etiqueta que deben utilizarse (xx = código ISO de lengua) |
Comentario |
Etiquetas léxicas preferentes |
prefLabel_xx |
Se espera una etiqueta "prefLabel_es". |
Etiquetas léxicas alternativas |
altLabel_xx |
|
Etiquetas léxicas ocultas |
hiddenLabel_xx |
|
Definición |
definition_xx |
|
Nota |
note_xx |
|
Nota de alcance |
scopeNote_xx |
|
Nota editorial |
editorialNote_xx |
|
Nota histórica |
historyNote_xx |
|
Nota de cambio |
changeNote_xx |
|
Ejemplo |
example_xx |
|
Concepto más amplio |
broader_xx |
Se espera una etiqueta "broader_es". |
Concepto relacionado |
related_xx |
Se espera una etiqueta "related_es". |
Colección |
group_xx |
Se espera una etiqueta "group_es". |
Mapeo exacto |
exactMatch |
|
Mapeo cercano |
closeMatch |
|
Mapeo amplio |
broadMatch |
|
Mapeo estrecho |
narrowMatch |
|
Mapeo relacionado |
relatedMatch |
|
Reemplace "xx" con el código ISO de 2 caracteres del idioma; ejemplo "prefLabel_es" para la etiqueta léxica preferente española. Ver la lista de códigos ISO 639-1.