Linked open data
Les Linked Open Data ou « données ouvertes liées » consiste à rendre libre de toute licence des bases de données préalablement liées entre elles selon le modèle du Linked Data de Tim Berners-Lee. Ce système rend la recherche sur le Web plus efficace et dynamique pour l'utilisateur en reliant d'autres sources d'informations pertinentes et insoupçonnées à la recherche initiale. Le fait que les données soient libres permet leur accès et leur réutilisation sans aucune restriction.
Le Linked Open Data s'inscrit dans le Web 3.0 qui est un Web de données. À la différence du Web 1.0 qui regroupe quantité de documents individuels sous la forme de silos de données isolés des uns des autres, le Web 3.0 est constitué de données brutes respectant toutes les mêmes standards du Web, ce qui rend leur utilisation, leur partage et leur interopérabilité très facile. Le Web des données prend forme à travers un modèle proposé par le W3C : le Web sémantique, qui est un modèle commun permettant le partage et la réutilisation de données sont surtout présent par l’entremise d’une application, d’une compagnie ou d’une communauté[1]. La publication de cette immense quantité de données dans un format standard peut être traitée par des outils du Web sémantique. L'accessibilité doit être garantie autant aux données qu'aux liens entre celles-ci afin de créer une vaste toile d'information et de connaissances[2].
Enjeux
[modifier | modifier le code]Cette approche est devenue un modèle de structuration normalisée du web des données ouvertes ainsi constitué en réseau plus cohérent et efficient de données (et au-delà de sites internet), qui s'inscrit dans l'Informatique durable (grâce à plus de transparence, et moins de consommation de serveurs, économies d'énergie et de temps... à service rendu égal ou amélioré)[3].
De nombreux auteurs tels que Mihaela Mathieu, Antoine Zimmermann[4], Olivier Boissier, et Philippe Beaune, de l'ENSM-SE, estiment que la puissance des données ouvertes et liées (sémantiquement enrichi[5]) peut beaucoup apporter à la dynamique du développement durable[6] et donner de l'efficience[7] et du sens au Web[8].
Principes techniques
[modifier | modifier le code]Le Linked Open Data repose sur 4 principes de base essentiels[9]
- Les données doivent être libres de toute licence pour que des liens soient facilement faits entre elles.
- Chaque lien utilise le modèle Resource Description Framework (RDF). Un RDF triplet est une association triple de liens soi: sujet-prédicat-objet. Ce modèle permet de décrire formellement les ressources Web et leurs métadonnées, afin d'en permettre un traitement automatique et une certaine interopérabilité)
- Afin d'être localisée, chaque ressource possède un nom de référence, unique et permanent en ligne, Uniform Ressource Identifier (URI).
- Les données doivent être mise en ligne suivant le protocole standard HTTP.
.
Histoire
[modifier | modifier le code]Le linked open data est étroitement lié à l'essor du web sémantique. Ce dernier est à la base une idée de l'inventeur même du web, Tim Berners-Lee, qui publie en 2001 un article présentant le concept de web sémantique[10]. L'idée présentée peine à percer et à se concrétiser, sans doute à cause de la complexité technique sous-jacente. En 2006, Berners-Lee publie un second article, intitulé simplement Linked Data. Le concept commence alors à se populariser et gagne en visibilité.
La plus grande partie des données « ouvertes et liées » du Web étaient d'abord concentrées dans le web anglophone, mais avec des données déjà liées au-delà des frontières linguistiques (comme dans Wikipédia grâce aux liens interlangue, aujourd'hui pris en charge par Wikidata),
Puis l'intégration de liens dans d'autres langues (dont le français) ont permis au reste du monde (dont à la francophonie) de commencer à s'approprier ce mode d'exploitation de l'internet. Wikipédia est en outre conçu comme un réseau ouvert et lié interlangue.
Exemples
[modifier | modifier le code]- Wikidata est la plus grande base de données libre éditée de manière collaborative qui respecte les standards du Linked data. Elle est hébergée par la Wikimedia Foundation. Placée sous licence Creative Commons Zéro[11].
- DBpedia en un des exemples les plus connus et de grande taille, qui a adopté les normes du réseau linked open data[12] et celles du Web sémantique, faisant qu'elle a rapidement été fortement interconnectée à d'autres dépôts du web de données tels que GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg et Eurostat[12]. L'accès aux dépôt de données se fait avec des requêtes sur la base de données via SPARQL. Les informations étant stockées avec Resource Description Framework, on peut aussi récupérer des documents ressource en relation avec un concept directement via une URI, avec les formats CSV ou RDF (notamment via les formats N-Triple, N3, JSON, XML).
- Clean energy info portal : Pour Denise Recheis (experte autrichienne en gestion des connaissances), le « Clean Energy info portal (www.reegle.info) et le wiki Energy Info (www.openEI.org) sont conçus comme des passerelles vers une « mine d'informations » sur les problématiques d'énergies renouvelables, d'efficacité énergétique et de changement climatique. Ils sont hébergés respectivement par REEEP (Renewabel Energy and Energy Efficiency Partnership) et NREL (National Renewable Energy Laboratory), deux organisations très engagées sur l'idée des données ouvertes et liées et qui en ont intégré les principes essentiels »[13].
Initiative canadienne
[modifier | modifier le code]Le gouvernement du Canada a lancé en 2016 un projet de Linked Open Data afin d'offrir un moyen plus excitant et accessible pour découvrir le patrimoine canadien. Le Réseau canadien d'information sur le patrimoine CHIN[14] reprend le fonctionnement des données ouvertes liées dans le but d'augmenter la visibilité des collections de différents musées dont l'inventaire a été réalisé par Artefacts Canada.
Huit musées ont participé à cette initiative: The Art Gallery of Greater Victoria, The Art Gallery of Nova Scotia, The Art Gallery of Ontario, le Musée McCord, The McMichael Canadian Art Collection, le Musée des beaux-arts de Montréal, le Musée des beaux-arts du Canada et The Vancouver Art Gallery.
Le CHIN permet ainsi aux utilisateurs de référencer les métadonnées sur un artiste, un groupe d'artistes ou une œuvre d'art avec des liens vers Artefacts Canada ou alors d'utiliser ces mêmes métadonnées pour référencer du contenu Web propre à l'utilisateur.
Notes et références
[modifier | modifier le code]- « W3C Semantic Web Activity », sur w3.org (consulté le ).
- (en) « Web Standards », sur W3C (consulté le ).
- emse-01082423v1 Communication dans un congrès Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Open and Interoperable Socio-technical Networks ; SYNASC 2014 : 16th International Symposium on Symbolic and Numeric Algorithms for Scientific Computing, , Timisoara, Romania. <http://synasc.ro/2014/>
- emse-01082430v1 Pré-publication, Document de travail Antoine Zimmermann Documents de l'auteur . RDF 1.1: On Semantics of RDF Datasets 2014
- Syed Gillani, Gauthier Picard, Frédérique Laforest, Antoine Zimmermann. Towards Efficient Semantically Enriched Complex Event Processing and Pattern Matching OrdRing 2014 (emse-01087640v1à, Communication au 3 rd International Workshop on Ordering and Reasoning, Oct 2014, Trentino, Italy. 8p, Proceedings of the 3rd International Workshop on Ordering and Reasoning. <http://streamreasoning.org/events/ordring2014>
- Disambiguation over Linked Data Corpora Journal of Web Semantics, Elsevier, 2012, special issue on Web-scale Semantic Information Processing, Volume 10, pp.Pages 76-110. <10.1016/j.websem.2011.11.002>
- emse-01082498v1 Antoine Zimmermann, Nuno Lopes, Axel Polleres, Umberto Straccia. A general framework for representing, reasoning and querying with annotated Semantic Web data Journal of Web Semantics, Elsevier, 2012, Volume 11, pp.Pages 72-95. <10.1016/j.websem.2011.08.006>
- Andrei Ciortea, Olivier Boissier, Antoine Zimmermann, Adina Magda Florea. Adding a Social Dimension to the Web of Things ; Journées scientifiques SEmba 2013, Apr 2013, Saint Germain au Mont d'Or, France
- « Linked Open Data - What is it? » [vidéo], sur Vimeo (consulté le ).
- BERNERS-LEE, Tim, HENDLER, James et LASSILA, Ora. The semantic web. Scientific American. Mai 2001, p. 29‑37. Disponible à cette adresse: http://www.cs.umd.edu/~golbeck/LBSC690/SemanticWeb.html « Copie archivée » (version du sur Internet Archive)
- Wikidata – Introduction – Qu'est-ce que cela signifie ?.
- Voir notamment cette page du site de DBpedia pour un ensemble d'informations sur les méthodes et les ressources d'inter-relations
- Voir http://blog.okfn.org/2012/01/27/linked-open-data-and-low-carbon-development/
- « À propos - 150 années d'art canadien », sur canadiana.ca via Wikiwix (consulté le ).
Voir aussi
[modifier | modifier le code]Articles connexes
[modifier | modifier le code]Bibliographie
[modifier | modifier le code]- Francesco Beretta, « Données ouvertes liées et recherche historique : un changement de paradigme », Humanités numériques, OpenEdition.org, (ISSN 2736-2337, OCLC 1287694984, BNF 46916154, DOI 10.4000/REVUEHN.3349).
Liens externes
[modifier | modifier le code]- Vous avez dit linked open data?, par Jasmin Hügi et Nicolas Prongué