Les Creative Commons seront implémentées dans HAL version 3 !

juin 23, 2014 dans Annonce, Débats, Documentation, Les biens communs en action par SavoirsCom1

Mise à jour du 25/06/2014. Suite à la publication de cet article,  le CCSD apporte en commentaire le rectificatif suivant : « la recherche dans le texte intégral de tous les pdf déposés dans HAL sera bien proposée dans la v3 : elle sera possible via l’interface de recherche ainsi que via l’API. Sauf bien sûr pour les documents sous embargo ». Nous nous étions fondés sur une information erronée et nous aurions dû la vérifier. En tout cas, c’est une excellente nouvelle !

 

C’est officiel : les licences Creative seront implémentées dans la version 3 de l’archive ouverte pluridisciplianire HAL, qui devrait être mise en production à compter d’octobre 2014. Pour les fichiers auteur, les déposants auront la possibilité d’apposer l’une des 6 licences Creative Commons de leur choix.

En revanche, le déposant n’aura pas la possibilité de choisir la licence lorsqu’il déposera un fichier éditeur, pour la raison que l’auteur est dans ce cas lié par les termes de la licence signée avec la maison d’édition. Il faut que le contrat d’édition signé par l’auteur mentionne explicitement la possibilité d’utiliser une licence Creative Commons pour qu’il soit en mesure de le faire. Des modèles d’addendum aux contrats existent pour faciliter la négociation avec les éditeurs.

HALv3

En tout état de cause, l’implémentation des CC dans HAL constitue une avancée importante pour les archives ouvertes françaises, que le collectif SavoirsCom1 tient à saluer. Jusqu’à présent, les auteurs étaient contraints de « bricoler » pour être en mesure de placer leurs travaux sous Creative Commons dans HAL et les métadonnées de la plateforme n’intégraient pas de manière satisfaisante les conditions de réutilisation des articles.

Néanmoins, cette évolution vient tard , plus de 12 ans après la Déclaration de Budapest sur l’accès ouvert qui faisait à l’époque un lien direct entre et usage de licences libres :

Par « accès libre » à cette littérature, nous entendons sa mise à disposition gratuite sur l’Internet public, permettant à tout un chacun de lire, télécharger, copier, transmettre, imprimer, chercher ou faire un lien vers le texte intégral de ces articles, les disséquer pour les indexer, s’en servir de données pour un logiciel, ou s’en servir à toute autre fin légale, sans barrière financière, légale ou technique autre que celles indissociables de l’accès et l’utilisation d’Internet. La seule contrainte sur la reproduction et la distribution, et le seul rôle du copyright dans ce domaine devrait être de garantir aux auteurs un contrôle sur l’intégrité de leurs travaux et le droit à être correctement reconnus et cités.

Comme, en France ou ailleurs, ce point précis de la Déclaration de Budapest est resté longtemps non suivi d’effets, le paysage contemporain des archives ouvertes présente une situation paradoxale : l’usage des licences Creative Commons est bien moins fréquent du côté de la « Voie verte » des archives ouvertes, que du côté de la « Voie dorée », c’est-à-dire du modèle controversé auteur/payeur, proposé par de grands éditeurs comme Springer et Elsevier.

L’intégration des licences Creative Commons dans la plateforme HAL permettra de stimuler l’adoption des licences libres pour la diffusion des résultats de la recherche. Néanmoins, un résultat significatif ne pourra être atteint que si des évolutions législatives interviennent pour permettre aux auteurs de déposer systématiquement leurs articles en archives ouvertes, quelles que soient les clauses des contrats d’édition signés avec les éditeurs, comme la loi allemande le prévoit pour les travaux de recherche financés sur fonds publics. Un tel système d’Open Access par défaut devrait être accompagné de la possibilité – voire de l’obligation – pour les chercheurs de placer leurs travaux sous licence libre.

Parmi les autres nouveautés qui seront proposées dans HAL v3, figurent également de nouvelles API bien documentées.
Cependant, la possibilité de faire une recherche sur le texte intégral des articles n’est pas proposée, faute d’accord avec les éditeurs. Soit que les licences les interdisent expressément, soit que les éditeurs, tels Elsevier, bloquent par des clauses contractuelles, la fouille de données à partir d’API autres que celles qu’ils mettent à disposition des chercheurs. Or ce type d’API imposé par les éditeurs est bien souvent accompagné de restrictions d’usage : limitation dans le temps du nombre de requêtes, limitation du nombre de caractères par citation, déclaration préalable des chercheurs de leur projet de recherche, etc.

Le collectif SavoirsCom1 rappelle à ce propos son soutien à une exception au droit d’auteur en faveur du Text & Data Mining. Le droit de lire devrait entraîner le droit d’extraire et une archive ouverte comme HAL constitue un corpus particulièrement intéressant pour la fouille de données. L’extraction automatisée porte sur des idées et non des expressions originales et s’inscrit, à ce titre, dans le domaine public de l’information.

Pour se faire une idée de l’ensemble des nouveautés apportées par la v3 de HAL, vous pouvez vous reporter à ce Storify réalisé par @freddie2310