Skip to main content

Vocabulaire du traitement automatique des langues (POC)

Search from vocabulary

Vocabulary information


Title

Vocabulaire du traitement automatique des langues (POC)

Description

Le vocabulaire du traitement automatique des langues (TAL) est une ressource terminologique bilingue (français-anglais) issue de la transformation en SKOS d’une liste de termes hiérarchisée. Il regroupe plus de 1 600 concepts dont certains possèdent une ou plusieurs définitions.

Ce vocabulaire repose sur :
- la réutilisation, la fusion, l’homogénéisation et l’enrichissement de classes et propriétés provenant d’ontologies existantes, i.e. le vocabulaire de Linguistique, le thésaurus ThesoTM, le vocabulaire Théorie et traitement du signal, le dictionnaire Artes (Aide à la rédaction de textes scientifiques) développé par l’équipe de recherche de l’UFR EILA et du CLILLAC-ARP de l’Université Paris Cité et le travail de Bénard (2019) ;
- sur l’extraction de termes à partir de corpus dédiés (Istex, ACL Anthology Reference Corpus) ;
- le repérage humain de termes problématiques lors d’une expérience de post-édition (Bawden et al., 2024).

Le vocabulaire est téléchargeable dans les formats suivants : CSV, SKOS-XML et JSON-LD.

Creator

Institut de l’information scientifique et technique (Inist) - CNRS/UAR76
Projet ANR-22-CE23-0033 MaTOS Traduction automatique pour ouvrir la science - F. Yvon (dir.)

Version

1.0

Created

vendredi 26 avril 2024 00:00:00

Last modified

mercredi 3 juillet 2024 00:00:00

Attribution Name

Institut de l’information scientifique et technique (Inist) - CNRS/UAR76

cc:attributionURL

dc:alternative

Vocabulaire du TAL

Description

Cette ressource contient 1620 entrées terminologiques.

skosmos:shortName

Vocabulaire du TAL

URI

http://data.loterre.fr/ark:/67375/8LP

Resource counts by type

TypeCount

Term counts by language

Language Preferred terms Alternate terms Hidden terms