Vocabulary information
Title
Vocabulaire du traitement automatique des langues (POC)
Description
Le vocabulaire du traitement automatique des langues (TAL) est une ressource terminologique bilingue (français-anglais) issue de la transformation en SKOS d’une liste de termes hiérarchisée. Il regroupe plus de 1 600 concepts dont certains possèdent une ou plusieurs définitions.
Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).
Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).
Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.
Creator
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
Projet ANR-22-CE23-0033 MaTOS Traduction automatique pour ouvrir la science - F. Yvon (dir.)
Version
1.0
Created
vendredi 26 avril 2024 00:00:00
Last modified
mercredi 3 juillet 2024 00:00:00
Attribution Name
Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
cc:attributionURL
dc:alternative
Vocabulaire du TAL
Identifier
Description
Cette ressource contient 1620 entrées terminologiques.
skosmos:shortName
Vocabulaire du TAL
URI
http://data.loterre.fr/ark:/67375/8LP
Resource counts by type
Type | Count |
---|
Term counts by language
Language | Preferred terms | Alternate terms | Hidden terms |
---|