Passer au contenu principal

Vocabulaire du traitement automatique des langues (POC)

Choisissez le vocabulaire dans lequel chercher

Description du vocabulaire


Titre

Vocabulaire du traitement automatique des langues (POC)

Description

Le vocabulaire du traitement automatique des langues (TAL) est une ressource terminologique bilingue (français-anglais) issue de la transformation en SKOS d’une liste de termes hiérarchisée. Il regroupe plus de 1 600 concepts dont certains possèdent une ou plusieurs définitions.

Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).

Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.

Créateur

Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
Projet ANR-22-CE23-0033 MaTOS Traduction automatique pour ouvrir la science - F. Yvon (dir.)

Version

1.0

Date de création

vendredi 26 avril 2024 00:00:00

Date de dernière modification

mercredi 3 juillet 2024 00:00:00

Nom d'attribution

Institut de l’information scientifique et technique (Inist) - CNRS/UAR76

cc:attributionURL

dc:alternative

Vocabulaire du TAL

Description

Cette ressource contient 1620 entrées terminologiques.

skosmos:shortName

Vocabulaire du TAL

URI

http://data.loterre.fr/ark:/67375/8LP

Nombre d'entrées par type

TypeNombre

Nombre de termes par langue

Langue Termes préférentiels Termes synonymes Termes cachés