Lingua Libre — Wikipédia
Aller au contenu
Un article de Wikipédia, l'encyclopédie libre.
Lingua Libre
Aperçu de la page d’accueil
de Lingua Libre en décembre 2020
Adresse
lingualibre.org
Description
Projet d’enregistrement de langues
Slogan
La médiathèque linguistique participative de Wikimédia France
Commercial
Non
Écrit en
PHP, VueJS, JS
Publicité
Non
Type de site
Outil d’enregistrement de langues,
Médiathèque linguistique en ligne
Langue
Multilingue
Inscription
facultative, nécessaire pour enregistrer
Propriétaire
Wikimédia France
Créé par
Wikimédia France
et la communauté Wikimédia
Nicolas Vion (v1)
Antoine Lamielle (v2)
Lancement
Novembre
2015
État actuel
En activité
modifier
Lingua Libre
est un
outil
et un
projet collaboratif
en ligne visant à constituer un
corpus
audiovisuel
multilingue
. Développé par l'association
Wikimédia France
, les codes et fichiers téléchargeables par langues
sont placés sous
licence libre
, comme les autres projets du
mouvement Wikimédia
. 230 langues et 1,2 million de fichiers audios sont téléchargeables avec différentes quantités de mots enregistrés.
Description
modifier
modifier le code
Lingua Libre permet d'enregistrer des
mots
, des
locutions
ou des
phrases
de toutes les langues, orales (
enregistrement audio
) ou
signées
enregistrement vidéo
). Les mots sont présentés au
locuteur
sous la forme d’une liste, créée en direct ou à l’avance, ou réutilisant une catégorie Wikimédia existante. Le locuteur lit simplement le mot affiché à l'écran, et le logiciel passe au mot suivant lorsqu’il détecte un silence après le mot lu
. Ce principe, repris du logiciel open source
Shtooka recorder
avec l'aide de son créateur, Nicolas Vion, permet d'enregistrer plusieurs centaines de mots par heure. Les enregistrements sont ensuite téléversés automatiquement depuis le
client web
vers la médiathèque libre
Wikimedia Commons
. Le projet est intégré à et soutenu par la
communauté wikimédienne
Utilisation des enregistrements
modifier
modifier le code
Les enregistrements sont consultables à la fois sur Lingua Libre et sur Commons. Ils sont principalement utilisés sur d'autres projets Wikimédia, afin par exemple d'illustrer des entrées sur le
Wiktionnaire
ou des noms propres dans des articles
Wikipédia
. Ils sont également produits et utilisés par le
Dico des Ados
La réutilisation des enregistrements dans un cadre d'
enseignement des langues
est envisagée.
Les enregistrements sont également librement
téléchargeables
par langue
, réutilisés dans des projets de
traitement automatique des langues
, notamment pour entraîner les moteurs de reconnaissance vocale DeepSpeech de
Mozilla
Versions
modifier
modifier le code
Lingua Libre est lancé le
23 janvier 2015
. Lingua Libre a connu trois versions principales.
Lingua Libre v.1 (2016)
modifier
modifier le code
Session d'enregistrement du vocabulaire
basque
lors de la Wikiconvention francophone 2016, mené par Nicolas Vion (gauche).
Dans le cadre du projet
Langues de France
, ayant pour objectif de documenter et valoriser les langues régionales de France sur les projets Wikimédia et internet de manière générale, la conception de Lingua Libre démarre en
novembre 2015
, en partie subventionnée par la
Délégation générale à la langue française et aux langues de France
(DGLFLF). La première version du projet est lancée en
août 2016
. Seulement adaptée à l’enregistrement audio, Lingua Libre est montré lors d’un atelier autour de l’
occitan
en
décembre 2016
puis est présenté à la communauté Wikimédia en ligne
et lors d’événements internationaux en 2017.
Lingua Libre v.2 (2018)
modifier
modifier le code
Une reconstruction complète est lancée fin 2017. La nouvelle version de Lingua Libre est basée sur
MediaWiki
, utilise
Wikibase
et
OAuth
pour mieux s’intégrer à l’environnement Wikimédia. L’interface est traduite via
Translatewiki
afin que le projet puisse être utilisé par un grand nombre de communautés. La nouvelle version du site est prête en
juin 2018
et ouverte au public en
août 2018
Lingua Libre v.2.2 (2020)
modifier
modifier le code
En 2020, d’importants changements sont apportés à la plateforme ; une nouvelle apparence est développée pour le site et le domaine en
.org
remplace le domaine en
.fr
utilisé jusque-là
10
. Lingua Libre prend en charge les
langues signées
grâce à l'
enregistrement vidéo
Évolution
modifier
modifier le code
Interface de
Shtooka
recorder, sur lequel Lingualibre se base.
Studio d’enregistrement en septembre 2017 (v.1)
Studio d'enregistrement en décembre 2018 (v.2)
Studio d’enregistrement en octobre 2020 (v.2.2)
Statistiques
modifier
modifier le code
Une session d’enregistrement avec une locutrice de la langue
atikamekw
en 2017 à
Montréal
Durant les deux premières années de lancement du projet, environ 10 000 enregistrements ont été réalisés. Le passage à la v.2 est accompagné d’une forte augmentation de la contribution. Le nombre d’enregistrements est multiplié par 10 en moins d’un an, dépassant le seuil de 100 000 en
mai 2019
. Ces enregistrements ont été réalisés par 127 locuteurs, dans près de 50 langues
11
. Le cap des 500 000 enregistrements est dépassé au cours du mois de
juin 2021
. En
avril 2023
, la plateforme comptabilise plus de 800 000 enregistrements, dans 170 langues et grâce à plus de 1400 locuteurs
12
. Le
5 octobre 2023
, Lingua Libre a atteint plus d‘un million de contributions avec l‘enregistrement du mot “కంటతము“ qui veut dire épineux en télougou (Inde du Sud)
13
Notes et références
modifier
modifier le code
(en)
LinguaLibre.org
», sur
GitHub
(consulté le
17 novembre 2023
et
Lingualibre Languages Gallery
», sur
lingualibre.org
(consulté le
8 janvier 2024
et
(de)
Sabine Buchwald, «
Wie Wikipedia Bairisch lernt
», sur
Süddeutsche Zeitung
4 août 2019
Forum de Mozilla mentionnant Lingua Libre comme source de données d’entraînement
Rémy Gerbet, «
Lingua Libre : un nouvel outil collaboratif pour le public et les chercheurs
»,
Culture et recherche
137, printemps-été 2018,
p.
52
ISSN
1950-6295
lire en ligne
Oc-a-thon 2016 : deux journées contributives sur l'occitan les 9 et 10 décembre
», sur
Ministère de la Culture - DGLFLF
20 novembre 2016
Mathieu Denel, «
L’oc-a-thon, un edit-a-thon pour enrichir les projets Wikimedia et Lingua Libre en langue occitane
», sur
Blog de Wikimédia France
21 décembre 2016
(consulté le
3 décembre 2020
Lingua Libre
», sur
fr.wiktionary.org
Actualités du Wiktionnaire
er
août 2017
(consulté le
2 décembre 2020
Lingua Libre
», sur
fr.wiktionary.org
Actualités du Wiktionnaire
er
juillet 2018
(consulté le
2 décembre 2020
Sarah
Krichen
, «
Lingua Libre fait peau neuve !
», sur
Wikimédia France
2 juin 2020
(consulté le
2 décembre 2020
(en)
Miguel Trancozo Trevino, «
The many languages missing from the internet
», sur
BBC.com
15 avril 2020
(consulté le
2 décembre 2020
Statistiques — Lingua Libre
», sur
lingualibre.org
(consulté le
8 janvier 2024
Wikimedia Fance, «
Communiqué de presse
[PDF]
(consulté le
28 novembre 2023
Annexes
modifier
modifier le code
Sur les autres projets Wikimedia :
Lingua Libre
, sur
Wikimedia Commons
Projet:Coopération/Lingua Libre
sur le
Wiktionnaire
Lingua Libre
sur
Meta-Wiki
Articles connexes
modifier
modifier le code
Shtooka
, logiciel et ancêtre de Lingua Libre.
Common Voice
, base d'enregistrements audios collaborative orientée vers les systèmes de
reconnaissance vocale
Forvo
, base d'enregistrement de mots, non libre.
Bibliographie
modifier
modifier le code
Mathilde
Hutin
et Marc
Allassonnière-Tang
, «
Crowd-sourcing for Less-resourced Languages: Lingua Libre for Polish
»,
Proceedings of the 1st Annual Meeting of the ELRA/ISCA Special Interest Group on Under-Resourced Languages
, European Language Resources Association,
juin 2022
p.
41–47
lire en ligne
, consulté le
25 novembre 2024
Mathilde
Hutin
et Marc
Allassonnière-Tang
, «
Investigating phonological theories with crowd-sourced data: The Inventory Size Hypothesis in the light of Lingua Libre
»,
19th SIGMORPHON Workshop on Computational Research in Phonetics, Phonology, and Morphology
, Association for Computational Linguistics,
juillet 2022
p.
23–28
DOI
10.18653/v1/2022.sigmorphon-1.3
lire en ligne
, consulté le
25 novembre 2024
Liens externes
modifier
modifier le code
Site officiel
“Lingua Libre”, émission spéciale Francophonie
», sur
RFI.fr
22 mars 2017
(consulté le
2 décembre 2020
Wikipédia
Wikipédia en bref
Liste des éditions
MediaWiki
Fiabilité
Vérification des faits
(en)
Vandalisme
Conflits d'intérêts
Critiques
Censure
en Turquie
en Inde
Liste des personnes emprisonnées pour avoir contribué à Wikipédia
Déséquilibres
de genre
géographiques
idéologiques
(en)
ethniques
(en)
Communauté
Administrateurs
(en)
AfroCROWD
Art+Feminism
Bot de Wikipédia
Lsjbot
Diversité
Les sans pagEs
Lingua Libre
WikiAfrica
WikiIndaba
Wiki Loves Monuments
Wiki Loves Earth
Wiki Science Competition
Wiki Loves Pride
(en)
Wiki Conference India
(en)
WikiConference North America
(en)
Wikimania
Wikimédien en résidence
WikiProjet
(en)
Women in Red
Wikipédiens notables
Florence Devouard
Sue Gardner
James Heilman
Maryana Iskander
Katherine Maher
Magnus Manske
Bernadette Meehan
Erik Möller
Ira Brad Matetsky
(sw)
Larry Sanger
María Sefidari
Lila Tretikov
Jimmy Wales
Wikimédien de l'année
Histoire
Bomis
Logo
Controverses
(en)
Modifications de Wikipédia par le personnel du Congrès américain
(en)
Henryk Batuta
Extrême droite sur Wikipédia en croate
Affaire Essjay
Affaire Seigenthaler
Station hertzienne militaire de Pierre-sur-Haute
Canular de Jar'Edo Wens
(en)
Canulars de Zhemao
Internet Watch Foundation
Scientologie
(en)
Manifestations contre SOPA et PIPA
Anomalies sur l'article consacré à la catastrophe d'Hillsborough
(en)
MyWikiBiz
1Lib1Ref
Traitement de la politique américaine
(en)
Traitement de la pandémie de Covid-19
(en)
Actions entreprises par la WMF sur Wikipédia en chinois
(en)
Wikimedia Entreprise
Distinctions
Prix Quadriga 2008
Monument à Wikipédia
Prix Érasme 2015
Prix Princesse des Asturies 2015
Références et analyses
Culturelles
(en)
Bibliographie
Travaux universitaires
(en)
Listen to Wikipedia
(en)
Wikipediocracy
(en)
Wikipedia Scanner
Wikipedia Review
(en)
Accès sur mobile
Liste d'applications Wikipédia pour téléphone mobile
(en)
QRpédia
Wapedia
WikiNodes
(en)
Wikipedia Zero
Wikiwand
Réutilisation des contenus
Livres Groupe
Boundless (entreprise)
(en)
DBpedia
Deletionpedia
Kiwix
WikiReader
Diffusion de la science
Information sur la santé
(en)
Plagiat de Wikipédia
Projets similaires
Interpedia
Nupedia
Citizendium
Enciclopedia Libre Universal en Español
Liste d'encyclopédies en ligne
Thèmes connexes
The Iraq War: A Historiography of Wikipedia Changelogs
Print Wikipedia
Magna Carta (An Embroidery)
Depths of Wikipedia
Il était une fois Wikipédia
Viola wikipedia
Wiki rabbit hole
(en)
Wikigacha
Wikiracing
(274301) Wikipédia
Fondation Wikimédia
Mouvement Wikimédia
Liste des éditions de Wikipédia
Catégories
Portail de Wikimédia
Portail des langues
Portail de la linguistique
Ce document provient de «
».
Catégories
Projet utilisant MediaWiki
Prononciation des langues
Wikimédia France
Catégories cachées :
Page utilisant P571
Article utilisant une Infobox
Catégorie Commons avec lien local identique sur Wikidata
Page utilisant P856
Page utilisant un modèle Bases inactif
Article utilisant le modèle Dictionnaires inactif
Page utilisant le modèle Autorité inactif
Article contenant un appel à traduction en anglais
Article contenant un appel à traduction en swahili
Portail:Wikimédia/Articles liés
Portail:Internet/Articles liés
Portail:Associations/Articles liés
Portail:Langues/Articles liés
Portail:Langues/Articles liés directement
Portail:Société/Articles liés
Portail:Linguistique/Articles liés
Portail:Sciences humaines et sociales/Articles liés
Lingua Libre
Ajouter un sujet
US