Ortolang
Ortolang (ou ORTOLang) est le nom d'un équipement d’excellence dans le domaine des ressources et outils de traitement de la langue. Il s'inscrit en France dans le cadre des « Investissements d'avenir ». Le nom Ortolang est d'abord apparu comme l'acronyme anglais de Open Resources and TOols for LANGuage (« Ressources ouvertes et outils pour la langue »), puis il a été transcrit en un acronyme français de signification un peu différente : « Outils et Ressources pour un Traitement Optimisé de la LANGue »[1].
Enjeux
Dans un contexte de Recherche en linguistique où le traitement de la langue est de plus en plus informatisé, tout en nécessitant encore un travail important d'annotation et de production de métadonnées (fait de manière "manuelle" ou semi-automatisée), Ortolang est un « réservoir de données » conçu comme une infrastructure en réseau, contenant des corpus, lexiques, dictionnaires, etc. associés à divers outils d'analyse lexicale et linguistique, qui se veut accessible à tous.
Objectif
Les buts affichés de ce nouvel outil sont :
- mieux recenser, valider[2], cataloguer[2], enrichir[2] archiver (de manière interopérable, selon le modèle OAIS (« Open Archival Information System » « Open Archival Information System » (OAIS, article anglophone de Wikipedia ), et mutualiser les moyens et contenus de recherche sur « l’analyse, la modélisation et le traitement automatique de notre langue de se hisser au meilleur niveau international », en s'appuyant sur les moyens français que sont LORIA[3], LPL[4], ATILF[5], LLL[6], Modyco[7];
- améliorer les usages, (notamment en accompagnant les utilisateurs[2]), améliorer les transferts de ressources et outils, surtout des laboratoires publics vers les partenaires industriels (PME qui souvent manquent de moyens pour accéder à ces données et outils) ;
- valoriser « le français et les langues de France à travers un partage des connaissances sur notre langue accumulées par les laboratoires publics ».
- pérenniser et généraliser les résultats des deux Centres de Ressources Numériques (centres numériques de qualité certifiée ; Trusted Digital Repository) sur la langue ; le CNRTL (Centre National de Ressources Textuelles et Lexicales[8]) et le SLDR [9]
Positionnement dans les infrastructures de recherche
En complément des efforts de la DGLFLF et de la BNF sur les corpus en langues de France, ORTOLANG doit devenir le « nœud français de l’infrastructure CLARIN » (Common Language Resources and Technology Infrastructure) et la principale plateforme technique sur l'écrit et l'oral, en coordonant le travail de la TGIR Huma-Num[10]
Notes et références
- ↑ Accueil d'Ortolang sur le site du CNRTL.
- 1 2 3 4 Ortolang (onglet "fonction"), consulté 2013-06-28
- ↑ Loria
- ↑ LPL
- ↑ ATILF
- ↑ LLL
- ↑ MODYCO
- ↑ Portail du CNRTL (Centre National de Ressources Textuelles et Lexicales)
- ↑ portail du SLDR (Banque de données parole et langage)(SLDR qui se prononce ‘SpLanDR’ étant l'acronyme de Speech and Language Data Repository)
- ↑ Portail d'ORTOLANG, onglet "objectifs".
Voir aussi
Articles connexes
- Langage
- Techniques d'écriture
- Linguistique, multilinguisme
- Interlinguistique
- Linguistique informatique
- Traitement automatique du langage naturel
- Linguistique informatique
- Lexical markup framework (LMF), travaux de normalisation ISO des lexiques du TAL
- Modular Audio Recognition Framework (MARF)
- Reconnaissance d'entités nommées
- LREC
- LRE Map (bbase de données de ressources pour le Traitement automatique de la langue)
- Liste des notions utilisées en linguistique
- Philologie
- Psycholinguistique
- Sémantique
- Sémiologie
- Sociolinguistique
- Bibliographie de logique et de philosophie du langage]
- Corpus
- Oralité
Liens externes
- Portail d'Ortolang, onglet "objectifs"
- Glossaire typographique et linguistique
- Quelques termes linguistiques
Bibliographie
- Durrer, Sylvie, 1998, Introduction à la linguistique de Charles Bally, Delachaux & Niestlé, (ISBN 978-2-603-01088-4).
- Martin, Robert, 2002, Comprendre la linguistique, PUF, coll. « Quadrige », (ISBN 978-2-13-054549-1)
- Normier, Bernard, 2007, L'apport des technologies linguistiques au traitement et à la valorisation de l'information textuelle, éditions ADBS, (ISBN 978-2-84365-092-5).
- Portail de la linguistique
- Portail de la langue française et de la francophonie