Wikidata

base de connaissance utilisée par les différents projets du mouvement Wikimédia

Wikidata est une base de connaissances librement améliorable, conçue pour centraliser les données utilisées par les différents projets du mouvement Wikimédia[1]. Une mise à jour d'une fiche Wikidata se répercute automatiquement sur toutes les pages de projets Wikimédia qui y font appel. Plus largement, Wikidata est destiné à fournir une source commune de données objectives, telles que les dates de naissance de personnalités ou le produit intérieur brut des pays[1].

Logo de Wikidata

Adresse wikidata.org
Description Base de données libre et participative
Slogan La base de connaissances gratuite et accessible à tous
Commercial Non
Publicité Non
Type de site Wiki
Langue Multilingue
Inscription Facultative
Propriétaire Fondation Wikimédia
Créé par Wikimedia Deutschland
Lancement
État actuel En activité

Histoire

modifier

Le site a été ouvert aux premières contributions le [2],[3]. La création de ce projet a été financée par des dons de l'Allen Institute for Artificial Intelligence pour 50 %, la Gordon and Betty Moore Foundation et Google pour 25 % chacun, pour un montant total de 1,3 million d'euros[4],[3].

 
Équipe de développement de Wikidata en 2012.

Historiquement, Wikidata a été précédé par d'autres projets de base de données cherchant à exploiter les données de Wikipédia, DBpedia notamment a été largement utilisé pour l'extraction et le traitement de contenu de l'encyclopédie[5]. Le concept a d'abord émergé du côté de Wikimedia Deutschland qui a pris en main le développement du projet jusqu'au déploiement, qui a été alors confié, ainsi que la maintenance, à la Fondation Wikimédia et à une équipe de huit développeurs dirigée par les deux fondateurs de Semantic MediaWiki, Denny Vrandečić et Markus Krötzsch[3].

Le déploiement de Wikidata s'est déroulé en trois phases[3] :

  1. Création de l'ensemble des fiches des articles des 280 Wikipédias en différentes langues ;
  2. Ouverture à l'édition et à la création de données ;
  3. Création automatique de listes et de graphiques exploitant les données, réutilisables dans les Wikipédias.

Wikidata a été présenté en lors de la Semantic Tech & Business Conference[3]. Son ouverture a été initialement annoncée au printemps 2013[1]. Sa création s'inscrit dans un contexte de développement croissant du web sémantique, qui consiste en l'agrégation, l'analyse et l'utilisation de données éparses et permet ainsi de répondre à des requêtes complexes. WolframAlpha permet déjà ce type de réponses grâce au moteur de Mathematica et à sa base de données[6].

Il était prévu que la Wikipédia en hongrois soit la première à mettre en place l'utilisation des données de Wikidata dans Wikipédia. Cependant, avant ceci, le logiciel MediaWiki devait être mis à jour et un client spécifique à Wikidata devait être créé[7]. Les premiers articles en hongrois ont commencé à exploiter Wikidata à la mi-.

 
Logo original proposé en 2012 par Planemad.

Le logo, réalisé par Arun Ganesh sous le pseudonyme Planemad, a été sélectionné par la communauté internationale de Wikimédia lors d'un vote qui a eu lieu du 3 au [8]. Sur les 33 propositions, ce logo a reçu 89 votes favorables sur près de 1 000 votes[9]. Le code-barres compose le mot « wiki » en morse[10].

Depuis , Abstract Wikipedia est un projet de la Fondation Wikimédia qui vise à créer une version indépendante d'une langue de Wikipédia, en utilisant des données structurées provenant de Wikidata[11].

Organisation et fonctionnement

modifier

Principes

modifier
 
Liens inter-langue-wiki : avant après Wikidata

Wikidata est une collection de pages qui sont stockées dans une base de données orientée documents. Chaque page est constituée de données et de couples clé-valeur, particulièrement des liens vers d'autres pages, formant donc un ensemble de graphes sémantiquement structuré. L'ambition est de former un graphe de connaissance unique[12]. Wikidata est propulsé par Wikibase, bibliothèque logicielle diffusée sous une licence libre[13].

Wikidata permet d'utiliser les données de son référentiel au sein des projets de la Fondation Wikimédia soit par ajouts spécifiques à la wikisyntaxe, soit en utilisant le langage Lua.

Contrôle des modifications

modifier

Licence

modifier

Le contenu de Wikidata est protégé par la licence CC0[14].

À les textes publiés dans Wikipédia sont sous licence Creative Commons - Partage dans les mêmes conditions 4.0 International (CC-BY-SA 4.0) et licence de documentation libre GNU (GFDL).

Financement

modifier

Trois entités ont apporté un financement significatif au développement de Wikidata : l’Allen Institute for Artificial Intelligence (50 %), la Gordon and Betty Moore Foundation (25 %) et Google (25 %). Les deux premières partagent un cofondateur de Microsoft et d'Intel[15].

Réception

modifier

En , Wikidata a reçu le Open Data Publisher Award de l'Open Data Institute « pour son ampleur et son ouverture intégrée »[16].

En , Google a annoncé qu'il fermerait Freebase au profit de Wikidata[17].

Depuis , les informations de Wikidata sont utilisées dans 58,4 % de tous les articles de Wikipédia en anglais, principalement pour des identifiants externes ou des emplacements de coordonnées. Au total, 64 % de toutes les pages de Wikipédia, 93 % de tous les articles de Wikivoyage, 34 % de tous les Wikiquotes, 32 % de tous les Wikisources et 27 % de tous les Wikimedia Commons contiennent des données de Wikidata. L'utilisation dans d'autres projets de la Fondation Wikimédia témoigne de l'intérêt de Wikidata[18].

En , les données de Wikidata étaient visualisées par au moins 20 autres outils externes[19] et plus de 300 articles ont été publiés sur Wikidata[20].

L'ensemble de données structuré de Wikidata a été utilisé par des assistants virtuels tels que Siri d'Apple et Alexa d'Amazon[21].

Exemples d'applications

modifier
  • L'extension Mwnci peut importer des données de Wikidata vers des feuilles de calcul de LibreOffice Calc[22].
  • En 2019, une revue systématique des usages de Wikidata a été publiée, pour faire un point sur la recherche portant sur Wikidata, sur les manières dont la littérature scientifique en parle, sur ses usages, et sur les perspective et les lacunes de recherches pour le futur[23] ; concluant à une recherche encore émergente mais en croissance, liée à un potentiel important de Wikidata, qui reste cependant (en 2019) utilisé que par quelques disciplines et avec un écart important entre la recherche et la pratique. Les études sont surtout faites par des chercheurs européens, et reflètent la distribution du contenu de Wikidata, limitant encore ses applications mondiales[23].
    Il y a (en octobre 2019) des discussions sur l'utilisation des éléments QID par rapport à ce qu'on appelle les emoji QID[24].
  • Wiki Explorer (Application pour Android) permet de découvrir des choses présentes autour de l'utilisateur et de micro-éditer Wikidata.
  • KDE Itinerary (assistant de voyage open source soucieux de la confidentialité) utilise les données de Wikidata.
  • Google a lancé un projet d'analyseur sémantique de trame visant à analyser les informations sur Wikipedia et à les transférer dans Wikidata en proposant des déclarations pertinentes à l'aide d'une intelligence artificielle[25].

Risques

modifier

Selon TechCrunch, le fait que les données de Wikidata, publiées sous licence CC0, puissent être réutilisées par Google ou tout autre moteur de recherche, pourrait amener moins de consultations de Wikipédia du fait que les quelque 20 % des requêtes de Web sémantique pourraient être directement résolues par le moteur de Google[3].

Par ailleurs, d'après Mark Graham[26], la centralisation de données considérées comme « objectives » pourrait occasionner des problèmes jusque-là confinés aux articles de Wikipédia. Celui-ci explique que là où l'efficacité sera renforcée pour des données non polémiques comme « Tokyo est la capitale du Japon », les sujets plus polémiques comme la population d'Israël risquent de créer des débats localisés sur Wikidata, et dans une langue qui ne sera pas forcément comprise par les locuteurs du pays ou du sujet concerné en premier lieu[27].

Notes et références

modifier
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Wikidata » (voir la liste des auteurs).
  1. a b et c Julien L., « Wikidata veut faciliter la mise à jour de Wikipédia », High-Tech, sur Numérama, .
  2. (en) « Wikidata : Main Page » [« Wikidata:Page d'accueil »] (version du sur Internet Archive)
  3. a b c d e et f (en) Sarah Perez, « Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others », sur TechCrunch, .
  4. (en) Boonsri Dickinson, « Paul Allen Invests In A Massive Project To Make Wikipedia Better », sur Business Insider, .
  5. (en) Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak et Sebastian Hellmann, « DBpedia - A Crystallization Point for the Web of Data », Journal of Web Semantics (en), Elsevier, vol. 7, no 3,‎ (ISSN 1570-8268, lire en ligne).
  6. Anne-Claire Norot, « Les moteurs de recherche auront-ils réponse à tout ? », sur Les inrockuptibles, .
  7. (de) Torsten Kleinz, « Wikidata: Daten-Fundus für Wikipedia eröffnet », sur Heise online, .
  8. (en) Wikidata needs a logo and you can help!, blog de Wikimedia Deutschland.
  9. (en) And the winner is…, blog de Wikimedia Deutschland.
  10. Comme vérifiable au moyen du Wikidata morse code renderer.
  11. Thierry Noisette, « Abstract Wikipedia: un projet de traductions de l’encyclopédie depuis sa base de données », sur ZDNet France (consulté le ).
  12. (en) Fredo Erxleben, Michael Günther, Markus Krötzsch, Julian Mendez and Denny Vrandeci, « Introducing Wikidata to the Linked Data Web », Springer, ISWC,‎ (lire en ligne).
  13. (en) Giovanni Bergamin et Cristian Bacchi, « New ways of creating and sharing bibliographic information: an experiment of using the Wikibase Data Model for UNIMARC data », JLIS.it, vol. 9, no 3,‎ , p. 35–74 (ISSN 2038-1026, DOI 10.4403/jlis.it-12458, lire en ligne, consulté le ).
  14. Wikidata – Introduction – Qu'est-ce que cela signifie ?.
  15. Marie-Noëlle Doutreix et Aymeric Bouchereau, « Wikidata et les Gafam : partenariat et appropriation des données pour le développement d’assistants personnels intelligents », dans Information et stratégie, , 51–62 p. (lire en ligne)
  16. « First ODI Open Data Awards presented by Sirs Tim Berners-Lee and Nigel Shadbolt », sur web.archive.org, (consulté le ).
  17. Olivier Andrieu, « Google va fermer Freebase - Actualités SEO et moteurs », sur Abondance, (consulté le ).
  18. « WD_percentUsageDashboard », sur wdcm.wmflabs.or (version du sur Internet Archive).
  19. « Wikidata:Tools/Visualize data - Wikidata », sur www.wikidata.org (consulté le ).
  20. « Scholia », sur Scholia (consulté le ).
  21. (en-US) Tom Simonite, « Inside the Alexa-Friendly World of Wikidata », sur Wired (ISSN 1059-1028, consulté le ).
  22. (en) « Rob Barry / Mwnci - Deep Spreadsheets · GitLab », sur GitLab (consulté le ).
  23. a et b (en) Marçal Mora-Cantallops, Salvador Sánchez-Alonso et Elena García-Barriocanal, « A systematic literature review on Wikidata », Data Technologies and Applications, vol. 53, no 3,‎ , p. 250–268 (ISSN 2514-9288, DOI 10.1108/DTA-12-2018-0110, lire en ligne, consulté le ).
  24. « Public Review Issues », sur www.unicode.org (consulté le ).
  25. « SLING - A natural language frame semantics parser (sur Github) », (consulté le ).
  26. (en) « Professor Mark Graham », sur oii.ox.ac.uk, Oxford Internet InstituteUniversity of Oxford, (consulté le ).
  27. (en) Mark Graham, « The problem with Wikidata », Technology, sur The Atlantic, .

Voir aussi

modifier

Sur les autres projets Wikimedia :

Bibliographie

modifier
  • (en) Daniel Mietchen, Gregor Hagedorn, Egon Willighagen, Mariano Rico, Asunción Gómez-Pérez, Eduard Aibar, Karima Rafes, Cécile Germain, Alastair Dunning, Lydia Pintscher et Daniel Kinzler, « Enabling Open Science: Wikidata for Research (Wiki4R) », Research Ideas and Outcomes, Pensoft Publishers (d), vol. 1,‎ , e7573 (ISSN 2367-7163, DOI 10.3897/RIO.1.E7573). 
  • (en) Kartik Shenoy, Filip Ilievski, Daniel Garijo et Daniel Schwabe, « A study of the quality of Wikidata », Journal of Web Semantics, vol. 72,‎ , p. 100679 (ISSN 1570-8268, DOI 10.1016/j.websem.2021.100679, lire en ligne, consulté le ).
  • « Wikidata : un outil pour vous, les chercheurs | Acfas », sur www.acfas.ca (consulté le )

Liens externes

modifier