Aller au contenu

Sci-Hub

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 18 janvier 2020 à 21:33 et modifiée en dernier par Dhatier (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Sci-hub
Logo de Sci-Hub

Adresse sci-hub.se
Par réseau Tor : scihubi6jazqj2wq.onion
Liste d'adresses : adrien-chopin.weebly.com/where-is-sci-hub-libgen-today.html
Slogan To remove all barriers in the way of science (« Éliminer tout obstacle sur la voie de la science »)
Commercial  Non
Publicité  Non
Langue Anglais
Créé par Alexandra Elbakyan
Lancement
État actuel  Actif

Sci-hub (ou Scihub) est un site web fournissant un accès libre à des articles scientifiques obtenus par web scraping[1] en contournant les paywalls (« péages ») classiques des éditeurs académiques. Des publications sont ajoutées quotidiennement après avoir été téléchargées via des proxies d'établissement universitaires[2]. Il permet ainsi de consulter gratuitement plus de 62 millions d'articles[3],[4] dont l'accès coûterait sinon plus de 30 dollars environ par article[5],[6]. Il a été attaqué en justice par la maison d'édition scientifique Elsevier, car il s'agit d'une atteinte au droit d'auteur[7]. En novembre 2015, l'adresse originale, sci-hub.org, est fermée. Des domaines alternatifs sont alors mis en place, tels que sci-hub.io (qui ferme en avril 2016), sci-hub.cc, sci-hub.bz, sci-hub.ac et ainsi de suite. Bien que les FAI français bloquent l'accès au site, une version se trouve sur le réseau Tor.

Historique

Alexandra Elbakyan fondatrice de Sci-Hub, à l'Université Harvard en 2010.

Le projet Sci-Hub a débuté le [8]. Il a été fondé par Alexandra Elbakyan alors étudiante en neurosciences au Kazakhstan, dans le but de diffuser plus largement le savoir scientifique chez les personnes étant, comme elle, bloquées par les « paywalls »[3],[9].

Entre 2011 et le printemps 2013, Sci-hub fournissait un accès aux publications scientifiques sans les stocker, en utilisant des identifiants d'université ou d'organismes de recherche aléatoirement.

Parallèlement, LibGen commence à stocker des articles scientifiques issus de Sci-hub, en 2012.

En 2013, la demande en articles explose, notamment en Chine. Pour suivre cette demande Sci-hub a commencé à rediriger vers le répertoire de LibGen quand les articles y étaient déjà présents. Plus tard, la même année Alexandra Elbakyan a acquis de nouveaux serveurs, via une campagne de financement participatif, sur lesquels elle a installé une copie des données présentes sur LibGen dont un serveur est mort emportant avec lui quelque 40 000 articles.

À partir de 2014, le code source est réécrit et une fonction de recherche automatique des articles (utilisant automatiquement tous les identifiants) est mise en place. Des copies des serveurs sont effectuées et Alexandra Elbakyan cherche activement à compléter les manques de son répertoire en se basant sur les sujets et journaux les plus demandés[1].

Durant l'été 2015, de grandes bibliothèques universitaires apprennent que leurs coûteux abonnements à Elsevier et Wiley ont été détournés ou piratés pour ou par un serveur donnant un accès gratuit à des milliers puis des millions d'articles[10].

Les éditeurs les plus touchés ayant porté plainte, le nom de domaine original, Sci-Hub.org, est rapidement désactivé (en novembre 2015, sur décision de justice américaine[11]). Le même mois, le projet refait surface sous un nom de domaine en « .io »[12] et selon un article de 2016, « les dons des utilisateurs couvrent maintenant le coût des serveurs de Sci-Hub »[13]. La bibliothèque de données de Sci-hub abriterait, en mars 2017, environ 62 millions de documents[14], soit 68,9 % de la littérature scientifique référencée par CrossRef et 85 % des articles publiés par les éditeurs payants[15].

Principe d'utilisation

Le site est spécialement conçu pour copier les données cachées derrière les « péages » et les rendre accessibles à l'utilisateur (avec le titre ou le Digital Object Identifier (DOI) de l'article comme mot-clé), et il serait plus fiable pour trouver le texte intégral[13]. Il est également possible de passer par le moteur de recherche Google Scholar pour trouver un article puis de passer les barrières des éditeurs en utilisant l'extension Sci-Hub depuis son navigateur[1]. Pour ces raisons, il est de plus en plus tentant de l'utiliser pour la communauté étudiante, les académiques ou des personnes intéressées par les sujets traités, notamment dans les pays en développement tels que l'Inde et l'Indonésie[16], ainsi qu'en Iran, en Chine, en Russie et au Brésil[5]. Fournir aux institutions et aux pays financièrement défavorisés et manquant d'infrastructures scientifiques un accès aux résultats de la Recherche était expressément le but d'Alexandra Elbakyan dès la création du site. Elle a expliqué qu'elle avait téléchargé des documents de manière similaire pour effectuer son travail de recherche dans une université du Kazakhstan, étant donné son besoin d'en parcourir des centaines[17]. C'était le premier site à offrir un accès automatique et gratuit à large échelle, ceci lui valant parfois d'être comparé au « Robin des Bois de la science »[8].

Avant son lancement, les scientifiques, la communauté étudiante et le lectorat d'articles scientifiques non-abonnés pouvaient solliciter par courriel les auteurs des papiers nécessaires à leur recherche[8]. Au moment du lancement de Sci-Hub, des forums et réseaux sociaux scientifiques existaient aussi, comme le tag #ICanHazPDF sur Twitter[18]. Ce partage « manuel » semble supplanté par Sci-Hub et d'autres équivalents comme Library Genesis (LibGen) qui peuvent répondre à des milliers de requêtes par jour[8]. De facto Sci-Hub est devenu une sorte de première bibliothèque scientifique virtuelle ouverte et presque universelle, mais dont les contenus sont majoritairement illégalement mis à disposition (une partie est cependant originellement « open access »[13]). De la création du site en 2011 à février 2016, plus de 3 millions d'IP uniques auraient fait des demandes (sachant qu'une seule IP peut éventuellement désigner un établissement scolaire, une institution, un laboratoire ou un sous-ensemble universitaire regroupant parfois un grand nombre de personnes).

Utilisateurs

Un article publié par le site web du journal Science en avril 2016 est introduit par l'exemple d'un étudiant iranien qui devrait (en 2015) dépenser environ 1 000 $US par semaine (l'équivalent de toutes ses dépenses mensuelles) pour acheter les articles scientifiques de son domaine (plusieurs dizaines de dollars par article de quelques pages), que son université n'a pas les moyens de lui procurer (notamment à cause des mesures d'embargo) et alors qu'aucun des programmes d'aides au monde académique de pays en voie de développement (hormis Share Link) ne semblait pouvoir couvrir son domaine scientifique. Il ne pouvait que contacter individuellement les auteurs d'articles pour solliciter une copie gratuite, mais de nombreux liens d'adresse sont morts 50 jours après la publication[13]. L'article présente aussi le point de vue opposé : celui d'éditeurs tels qu'Elsevier dont le directeur tweetait : « Je suis pour l'accès universel, mais pas le vol ! » lors d'un débat houleux à propos de l'accès universel via Sci-Hub le [13].

L'auteur de l'article, John Bohannon, a négocié avec Sci-Hub (sans difficulté précise-t-il) de pouvoir analyser des données anonymisées de demande de consultation pour une période de 6 mois (de septembre 2015 à février 2016) pour répondre à des questions encore sans réponses : qui accède à la plateforme ? d'où ? et pour lire quoi ? Résultat : au moment de l'étude des dizaines de millions de contacts ont eu lieu en 6 mois avec environ 28 millions d'articles recherchés, dont plus de 2,6 millions demandés par des personnes de l'Iran, 3,4 millions en Inde et 4,4 millions en Chine. Des demandes ont émané de tous les continents sauf l'Antarctique et de presque tous les pays, pour tous les champs scientifiques et pour des articles récents, mais aussi anciens[13]. Jusqu'alors on ignorait qui consultait ces documents[13].

Selon cette étude, une partie de l'usage le plus intense de Sci-Hub est le fait de campus universitaires américains et européens[13]. Certains chercheurs semblent utiliser Sci-Hub par commodité plutôt que par nécessité alors qu'ils pourraient obtenir le même article de leur bibliothèque universitaire, ce qui pourrait expliquer que les États-Unis sont le cinquième pays (après la Russie) chargeant le plus d'articles et un quart des demandes faites à Sci-Hub provenant de 34 pays membres de l'OCDE, c'est-à-dire des pays réputés les plus riches et ayant théoriquement un accès facile aux périodiques scientifiques, via des abonnements universitaires (souvent, pour les revues de haut niveau, l'étudiant n'a accès qu'à des revues liées à son domaine d'étude, ce qui peut freiner la pluridisciplinarité)[13]. Les historiques de téléchargement montrent que ce site permet aussi à des chercheurs de continuer à travailler en Libye malgré la guerre civile[13].

Les flux temporels de téléchargement reflètent le rythme de vie des chercheurs de plus en plus actifs au fur et à mesure de l'avancée de la journée et pour certains jusque tard dans la nuit (ou toute la nuit). Fin février 2016, Sci-Hub atteint son record de téléchargements (plus de 200 000 demandes par jour)[13]. En juillet 2017, ce sont 700 000 articles qui sont téléchargés chaque jour[19].

À la suite de l'article de John Bohannon, le site web de la revue Science publiait les résultats d'un questionnaire de l'opinion de ces lecteurs, sur Sci-hub. Il en ressort que 88 % des 11 000 participants pensent que ce n'est pas « mal » de télécharger des articles sur le site créé par Alexandra Elbakyan[20].

Une étude publiée en avril 2017 montre que 35 % des téléchargements seraient des articles parus dans les deux dernières années. Les éditeurs les plus « téléchargés » seraient Elsevier et Springer Nature, tandis que les publications de Wiley-Blackwell et de l'Institute of Electrical and Electronics Engineers (IEEE) sont beaucoup moins téléchargées malgré leur important contenu[14].

Poursuites judiciaires

Une évaluation précise des pertes pour Elsevier ou Wiley est difficile, notamment parce que les statistiques de téléchargements des grands éditeurs ne sont pas publiques[13]. Selon Elsevier en 2010, l'ensemble des éditeurs auraient été spoliés de plus de 1 milliard de téléchargements par an et Sci-Hub pourrait « détourner » entre 4 et 5 % du trafic anticipé. Selon l'interview d'Alexandra Elbakyan sur le site web de Science, « de nombreux universitaires ont volontairement fait don » de codes d'accès à la plate-forme, et « elle n'a pas utilisé l'hameçonnage pour les obtenir »[13], sur son blog elle reconnait avoir imaginé que certains codes aient pu avoir été obtenus par piratage[1]. Il y a aussi des copies légales (plus de 4 000 au moment de l'étude) de documents publiés sous licence libre (par exemple sur PLoS), ce qui laisse penser que de nombreux utilisateurs utilisent la plate-forme comme un portail pratique pour consulter toutes sortes de travaux[13].

Le site est attaqué en justice, en droit américain auprès du tribunal de New-York, en juin 2015 par l'éditeur néerlando-britannique Elsevier, dans une affaire nommée Elsevier et al. v. Sci-Hub et al.[21]. La maison d'édition demande que les plateformes comme Sci-Hub, LibGen ou BookFi (en) cessent de distribuer des documents protégés par copyright. Elsevier argue que Sci-Hub accède illégalement aux comptes d'étudiants et d'institutions académiques pour contourner les paywalls de la plate-forme d'Elsevier, ScienceDirect. Sci-Hub étant hébergé à Saint-Pétersbourg en Russie, le système judiciaire américain n'a aucune autorité dans ce dossier[5]. Certains voient dans cette affaire un engagement d'Elsevier contre la libre diffusion des connaissances.
Malgré la fermeture du site original ordonnée par un tribunal de New York le , le site est toujours accessible à des noms de domaine alternatifs dès les mois qui suivent[3],[12]. Le site est également accessible par l'intermédiaire du réseau Tor[3].

L'Electronic Frontier Foundation, défendant les libertés sur Internet, a cité la déclaration universelle des droits de l'homme : « Toute personne a le droit […] de participer au progrès scientifique et aux bienfaits qui en résultent », pour soutenir Sci-Hub et le site frère LibGen[22]. Le procès a suscité de nombreuses critiques contre Elsevier[23].

En juin 2017 c'est l'American Chemical Society (ACS) qui intente un procès contre Sci-Hub, aux motifs de non-respect droit d'auteur, de contrefaçon de marque et de marque de commerce. Le 3 novembre 2017 un tribunal de district de Virginie a condamné Sci-Hub à 4,8 millions de dollars et à des intérêts. Le juge demande aussi aux fournisseurs de service du Web aux États-Unis (moteurs et sites de recherche, bureaux d'enregistrement de noms de domaine, registres de noms de domaine) de ne plus faciliter l'accès à tout ou partie des noms de domaine pour protéger la reproduction et la distribution des marques ACS ou des œuvres protégées par ACS[24]. Fin novembre 2017, les miroirs sci-hub.ac et sci-hub.cc et sci-hub.io sont injoignables à la suite du procès gagné par l'ACS[25],[26].

Daniel Himmelstein (chercheur de l'Université de Pennsylvanie), ayant lui-même évalué le nombre d'articles publiés par Sci-Hub estime que « cette affaire pourrait créer un précédent dans la mesure où des tierces parties sur Internet sont nécessaires pour imposer la censure imposée par le gouvernement »[24]. Sci-Hub ne pourra a priori pas verser les sommes qu'on lui demande, et il est géographiquement situé hors de l'aire de juridiction du tribunal. ACS a donc annoncé son intention de s'attaquer aux « entités qui ont été en concert ou en participation active avec Sci-Hub, comme les sites hébergeant du contenu ACS ». La Computer and Communications Industry Association (en) (CCIA) avait demandé lors du procès via un amicus curiae qu'ACS retire de ses demandes le blocage du fournisseur d'accès et des moteurs de recherche, ce qui a été refusé par le juge (alors que dans l'affaire Elsevier précédente, suite à une même demande le juge avait admis et soutenu la demande de la CCIA et de l'Internet Commerce Coalition ce qui avait poussé Elsevier à modifier ses demandes). Quelles que soient les mesures prises, « le mouvement pour la liberté de l'internet s'intéressera vivement aux procédures » a-t-il ajouté[24].

En France, le 7 mars 2019, le tribunal de grande instance de Paris ordonne aux fournisseurs d’accès à internet Orange, SFR, Free et Bouygues Telecom de bloquer l’accès à Sci-Hub ainsi qu’à LibGen à leurs clients[27]. Le tribunal a confirmé que la méthode de blocage pourra être choisie par les FAI. Les fournisseurs d’accès d'Orange et Bouygues Télécom ont fait valoir qu’ils souhaitaient choisir eux-mêmes les modalités du blocage, au lieu de celle suggérée par les éditeurs (le blocage par adresse IP)[28]. Des solutions ont d'ores et déjà été apportées afin de débloquer l'accès à Sci-Hub comme le changement de DNS, l'utilisation d’un VPN ou du réseau Tor [29].

Articles connexes

Notes et références

  1. a b c et d (en) Alexandra Elbakyan, « Some facts on Sci-Hub that Wikipedia gets wrong », sur engineuring, (consulté le ).
  2. (en) Darlene Storm, « Jump paywalls, score academic research for free, share it without being busted », sur Computerworld, (consulté le ).
  3. a b c et d (en) Quirin Schiermeier, « Pirate research-paper sites play hide-and-seek with publishers », sur News & Comment, Nature, (consulté le ).
  4. (en) Mary-Ann Russon, « Sci-Hub: Russian neuroscientist running 'Pirate Bay for scientists' with 48 million free academic papers », sur International Business Times, (consulté le ).
  5. a b et c (en) David Glance, « Elsevier acts against research article pirate sites and claims irreparable harm », sur The Conversation, (consulté le ).
  6. (en) « Netizen Report: Scholars in Colombia, Kazakhstan Face Legal Woes for Sharing Research », Future Tense, sur Slate, .
  7. (en) Ernesto, « Elsevier Cracks Down on Pirated Scientific Articles », sur TorrentFreak, (consulté le ).
  8. a b c et d (en) Simon Oxenham, « Meet the Robin Hood of Science », sur Big Think, (consulté le ).
  9. (en) Ernesto, « Sci-Hub Tears Down Academia's "Illegal" Copyright Paywalls », sur TorrentFreak, (consulté le ).
  10. (en) Carrie Russell et Edward Sanchez, « Sci-Hub unmasked Piracy, information policy, and your library », College & Research Libraries News (en), vol. 3, no 77,‎ , p. 122–125 (DOI 10.5860/crln.77.3.9457).
  11. (en) Ernesto, « Court Orders Shutdown Of Libgen, Bookfi And Sci-Hub », sur TorrentFreak, (consulté le ).
  12. a et b (en) Ernesto, « Sci-Hub, BookFi and LibGen Resurface After Being Shut Down », sur TorrentFreak, (consulté le ).
  13. a b c d e f g h i j k l m et n (en) John Bohannon, « Who's downloading pirated papers? Everyone », News, sur sciencemag.com, (DOI 10.1126/science.aaf5664).
  14. a et b (en) Bastian Greshake, « Looking into Pandora's Box: The Content of Sci-Hub and its Usage », F1000Research, vol. 6,‎ (DOI 10.12688/f1000research.11366.1).
  15. (en) Himmelstein D et al., « Sci-Hub provides access to nearly all scholarly literature », eLife,‎ (PMID 29424689, PMCID PMC5832410, DOI 10.7554/eLife.32822).
  16. (en) Maddie Stone, « Academic Publishing Giant Fights To Keep Science Paywalled », sur Gizmodo, (consulté le ).
  17. (en) Ernesto, « Science "Pirate" Attacks Elsevier's Copyright Monopoly in Court », sur TorrentFreak, (consulté le ).
  18. (en) Kaveh Waddell, « The Research Pirates of the Dark Web », sur The Atlantic, (consulté le ).
  19. Yves Eudes, « Alexandra Elbakyan, la Kazakhe pirate d’articles scientifiques », sur Le Monde.fr, (consulté le ).
  20. (en) John Travis, « In survey, most give thumbs-up to pirated papers », News, sur sciencemag.com, (DOI 10.1126/science.aaf5704).
  21. (en) Ali Sternburg, « Why is the Media Talking About SOPA Again: An Explainer », Disruptive Competition Project, (consulté le ).
  22. (en) Elliot Harmon, « What If Elsevier and Researchers Quit Playing Hide-and-Seek? », Electronic Frontier Foundation, (consulté le ).
  23. (en) « Simba Information: Five Professional Publishing News Events of 2015 Signal Times Are A-Changin' », PR Newswire, (consulté le ).
  24. a b et c (en) Dalmeet Singh Chawla, « Court demands that search engines and internet service providers block Sci-Hub », News, sur sciencemag.com, .
  25. (en) Ernesto, « Sci-Hub Loses Domain Names, But Remains Resilient », sur TorrentFreak, (consulté le ).
  26. « Sci-Hub perd trois de ses noms de domaine », sur Next INpact, (consulté le ).
  27. Marc Rees, « Les principaux FAI français doivent bloquer Sci-Hub et LibGen », sur Next INpact, .
  28. Nelly Lesage, « Sci-Hub et LibGen luttent pour la diffusion gratuite du savoir scientifique : la France ordonne leur blocage », sur Numerama, (consulté le ).
  29. Thibault Prévost, « Internet : la justice française bloque SciHub et LibGen, piliers du savoir libre », sur Konbini, .