Description du vocabulaire
Titre
Vocabulaire du traitement automatique des langues (POC)
Description
Le vocabulaire du traitement automatique des langues (TAL) est une ressource terminologique bilingue (français-anglais) issue de la transformation en SKOS d’une liste de termes hiérarchisée. Il regroupe plus de 1 600 concepts dont certains possèdent une ou plusieurs définitions.
Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).
Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).
Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Créateur
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
Projet ANR-22-CE23-0033 MaTOS Traduction automatique pour ouvrir la science - F. Yvon (dir.)
Version
1.0
Date de création
vendredi 26 avril 2024 00:00:00
Date de dernière modification
mercredi 3 juillet 2024 00:00:00
Nom d'attribution
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
cc:attributionURL
dc:alternative
Vocabulaire du TAL
Identifiant
Description
Cette ressource contient 1620 entrées terminologiques.
skosmos:shortName
Vocabulaire du TAL
URI
http://data.loterre.fr/ark:/67375/8LP
Nombre d'entrées par type
Type | Nombre |
---|
Nombre de termes par langue
Langue | Termes préférentiels | Termes synonymes | Termes cachés |
---|