Un front commun se dessine en faveur d’une exception pour le text and data mining

avril 14, 2014 dans Annonce

Le collectif SavoirsCom1 tient à saluer la prise de position commune de l’ADBU et du consortium Couperin relative au text and data mining (TDM), suite à leur audition par le Conseil supérieur de la propriété littéraire et artistique (CSPLA). Le consortium et l’association mettent en garde contre les menaces que fait encourir à la recherche la voie contractuelle. Celle-ci s’avère inadaptée aux pratiques des chercheurs et comporte des dispositions susceptibles de porter atteinte à leur indépendance. Certaines clauses sont synonymes de limitation de la portée de l’exception de courte citation et de restriction des conditions de réutilisation des données de la recherche. Enfin, la voie contractuelle est la porte ouverte à la constitution d’un nouveau marché de services basé sur la fourniture d’extractions de données, marché sur lequel les éditeurs garderaient la haute main. Couperin et l’ADBU montrent bien comment le droit à l’exploration des données scientifiques est indissociable du droit de lire et comment les pratiques de TDM ne télescopent pas mais neutralisent la revendication de droits de propriété intellectuelle liés aux bases de données.


Cette position rejoint celle déjà exprimée par le collectif SavoirsCom1, LIBER ou plus récemment encore, par le groupe d’experts européens mandaté par la Commission Européenne. Un front se constitue pour réclamer l’introduction d’une exception au droit d’auteur visant à sanctuariser les pratiques de traitement automatisé des données à des fins de recherche, à l’image de ce que le Royaume-Uni envisage de faire.

Néanmoins, SavoirsCom1 s’étonne de la contradiction dans laquelle Couperin se place en dénonçant la clause d’Elsevier sur le TDM après l’avoir lui-même ratifiée dans le protocole d’accord de licence nationale signé avec l’éditeur :

« Le consortium Couperin, qui vient de négocier avec Elsevier une licence nationale permettant la pratique du TDM sous les conditions que l’on vient de décrire [licence restrictive imposant le recours à une API fournie par l'éditeur et ne permettant le chargement que de 10 000 articles par semaine], souhaite à travers cette disposition identifier les usages que les chercheurs feront de cette fonctionnalité. Il estime que les possibilités de TDM proposées par Elsevier se relèveront foncièrement inadaptées aux pratiques de recherche. »

Ainsi donc, Couperin aurait validé la clause de TDM afin de réaliser une expérimentation permettant de démontrer in concreto l’inadaptation de ce type de clause ? Pourquoi faire encourir à la recherche française les risques de cette démonstration par l’absurde ?

Quoi qu’il en soit, la prochaine étape consistera dans la remise par le CSPLA de son rapport. SavoirsCom1 espère à ce moment que tous les acteurs concernés pourront agir ensemble afin de faire entendre leur voix.

D’ici là, les professionnels des bibliothèques doivent avoir conscience que toute nouvelle signature d’une clause contractuelle relative au text et data mining nous éloigne de la possibilité de trouver une solution plus satisfaisante par la loi. C’était d’ailleurs le but réel visé par Elsevier en présentant cette clause dans son accord. Plus des accords similaires seront acceptés par les bibliothèques, plus il sera difficile de militer en faveur d’une exception législative robuste.

Par ailleurs, la question se pose de savoir quand une opportunité se présentera pour défendre l’introduction d’une telle exception dans la loi. La future loi sur la création, pour laquelle le calendrier n’est pas encore fixé, sera pilotée par le Ministère de la Culture, qui sera par nature réticent à agir à propos d’un sujet concernant la recherche. Il appartient donc au Ministère de l’Enseignement Supérieur et de la Recherche de se saisir de la question du data mining, afin qu’elle ne soit pas traitée exclusivement sous l’angle restrictif qui est celui du Ministère de la Culture quand il s’agit d’exceptions au droit d’auteur.

Au-delà, il est évident que les chercheurs eux-mêmes devraient faire entendre leur voix sur le sujet et que les chances d’obtenir une évolution seront beaucoup plus fortes s’ils se mobilisent en faveur d’une exception pour le data mining.

Crédits photo : Hard Hats. Par b3d_. CC-BY 2.0

Patrimoine : une loi pour fermer les archives ?

avril 11, 2014 dans Annonce

prison-493x200[billet initialement publié sur le blog Papiers et Poussières, par Jordi Navarro]

Dès son arrivée au ministère de la culture, Aurélie Filippetti avait promis de revoir en profondeur le code du patrimoine. Elle en avait fait son cheval de bataille. Les reports successifs et le récent remaniement ont bien failli la priver de voir l’aboutissement de ce projet. Finalement maintenue dans ses fonctions, il y aura bien une « loi Filippetti sur le patrimoine ».

J’avais personnellement espéré beaucoup de choses de cette loi. Il me semblait que c’était l’occasion rêvée de codifier la loi CADA en l’intégrant au livre des archives du code du patrimoine. Le libre accès aux documents administratifs, ainsi que le droit à la libre réutilisation ont toute leur place au sein du chapitre 3 portant sur le régime de communication. Codifier la loi 78-753 aurait de plus été totalement en phase avec la volonté politique actuelle d’ouverture des données publiques.

Le moins que l’on puisse dire est que j’ai été amèrement déçu.

J’ai commencé à craindre le pire dès l’année dernière lorsqu’un texte préparatoire avait circulé dans la profession. Mais il ne s’agissait alors que d’un document de travail susceptible d’être encore modifié.
Mes craintes se sont hélas confirmées plus récemment lors d’une interview d’Hervé Lemoine à la Revue française de généalogie, suivie d’une audition au Sénat sur la réutilisation des informations publiques et, enfin, de la publication du pré-projet et de son étude d’impact.

Le projet consiste, ni plus ni moins, à mettre un terme à la libre communication des archives définitives en les sortant expressément du champ d’application de la loi CADA.

Pour bien comprendre de quoi il retourne, regardons ce qu’il en est actuellement.

La loi 78-753 indique que tout document administratif, dès lors qu’il est communicable, doit être communiqué à toute personne qui en fait la demande, quel que soit le lieu où se trouve le document (administration ou service d’archives), et quel que soit le motif de la demande (administratif, historique ou autre).
Cette communication peut se faire par consultation sur place (gratuitement), par envoi postal d’une reproduction (frais de copie et d’envoi à la charge du demandeur) ou, si cela est possible,  par mail (gratuitement). Le choix entre ces trois modes de communication appartient au demandeur, pondéré bien entendu par les possibilités du service et l’état du document.
Cette obligation de communication et le choix laissé au demandeur montrent très clairement la force que le législateur a voulu donner à ce principe. En matière d’accès aux documents administratifs, c’est à l’administration de tout mettre en œuvre pour satisfaire la demande de l’usager.
Cette obligation de transparence de la vie publique répond à un triple objectif. Il s’agit de permettre au citoyen de faire valoir ses droits, de lui assurer la possibilité de contrôler le fonctionnement de l’administration et de lui garantir l’accès à la mémoire collective.
Le principe de libre communicabilité est intimement lié à l’exercice de la démocratie.

Et voilà donc ce que cet avant-projet de loi entend remettre en question. Car voici ce que dit la nouvelle version de l’article L213-1 :

 Les archives publiques sont […] communicables de plein droit et sans délai.
L’accès à ces archives s’exerce dans les conditions définies pour les documents administratifs à l’article 4 de la loi n° 78-753 [...] jusqu’à leur transfert dans les services publics d’archives compétents.
Après transfert dans ces services, l’accès aux archives s’exerce par consultation gratuite sur place.
Par dérogation à l’alinéa précédent, l’accès aux archives continue de s’exercer dans les conditions définies pour les documents administratifs à l’article 4 de la loi du 17 juillet 1978 précitée quand il est motivé par les besoins de la gestion et de la justification des droits des personnes physiques et des personnes morales.
Les services publics d’archives peuvent également déterminer d’autres modalités d’accès aux archives.

Pour résumer, dès lors que les documents seront dans un service d’archives, ils ne seront plus librement communicables. À moins d’en avoir besoin pour des raisons administratives, il ne sera plus question pour l’usager d’exiger la communication à distance d’un document. La consultation sur place sera l’unique garantie apportée par la loi, charge aux services d’archives d’être plus généreux s’ils le souhaitent.
Pour la première fois, les documents seront moins accessibles dans les services d’archives que dans les administrations. Un comble.
Pourquoi un tel choix ? Pourquoi revenir sur ce principe démocratique ?
La justification en est donnée dans l’étude d’impact. Ou plutôt les justifications, puisque deux arguments sont avancés :

les modalités d’accès aux archives […] fragilisent les données à caractère personnel et alourdissent excessivement la charge de travail des services publics d’archives

Penchons-nous sur ces deux arguments.

Les données personnelles sont régulièrement utilisées depuis 2010 pour justifier des refus de réutilisation.
Rappelons tout d’abord que les délais de communicabilité prévus par le code du patrimoine sont justement là pour protéger l’accès aux données personnelles. Si ces délais sont jugés trop courts, la meilleure solution aurait sans doute été de les augmenter. Le pré-projet fait pourtant exactement l’inverse en proposant, par exemple, de diminuer le délai d’accès aux actes de mariage (passant de 75 à 50 ans). Comment peut-on, d’un côté, dire que le libre accès représente un risque pour les données personnelles et, d’un autre, diminuer les délais d’accès à ces mêmes données ? Schizophrénie ou hypocrisie ? Je vous en laisse juge.
Par ailleurs, pour les données personnelles communicables, la CADA, la Cnil et le juge administratif ont clarifié la question en expliquant très clairement ce qu’il est possible de faire ou non avec des données personnelles. Ces trois instances ont toutes les trois réaffirmé qu’une fois les fameux délais échus, les données personnelles sont librement communicables et qu’elles sont également réutilisables. Elles ont toutes les trois rappelé que la protection des données personnelles relève de la compétence de la Cnil. Elle seule est en mesure de dire ce qu’il est possible ou non de faire avec des données personnelles, ce qu’elle n’a pas manqué de faire. Le juge avait déjà affirmé que les archivistes n’avaient pas à se substituer à cette autorité. Dès lors qu’elle a autorisé un usage, cette autorisation s’impose à tous.
Et si un usager venait à ne pas respecter les dispositions de la Cnil, c’est à cette dernière qu’il devrait rendre compte puisque, rappelons-le, elle dispose de son propre pouvoir de sanction.

Rappelons enfin un point essentiel : la diversité des archives. Tous les documents administratifs ne comportent pas de données personnelles. Pourquoi donc limiter également l’accès à ceux qui n’en contiennent pas ?
Cet argument de protection des données personnelles ne tient pas la route.

Examinons maintenant le second argument, celui de la charge de travail.
L’idée est la suivante : initialement, les demandes d’accès aux documents administratifs sont gérées par les services qui produisent ces documents. La charge de travail est donc répartie au sein des différentes administrations. Mais dès que les documents ont été versés à un service d’archives, celui-ci devient le seul à gérer l’ensemble des demandes. La charge de travail se reporte donc sur un seul et unique service, ce qui poserait problème.
À titre d’illustration, l’étude d’impact indique que des usagers auraient très bien pu demander la copie de l’ensemble des 3600 kilomètres de documents conservés dans les services d’archives. Cet argument est d’une telle mauvaise foi que je ne vais pas m’y attarder outre mesure. Le fait est qu’une telle demande est tout simplement irréaliste.
Mais passons outre cette maladresse d’argumentation. La charge de travail est un point qui ne peut pas être éludé d’un simple revers de main. Regardons ce qu’il est en est.
Les statistiques publiées chaque année par le SIAF sont là pour nous aider. Si l’on regarde les chiffres des Archives départementales, on s’aperçoit qu’en 2012 chaque service a dû traiter en moyenne 1211 demandes par correspondance. Soit près de 5 demandes par jour ouvré. De plus, depuis 2010, le nombre de ces demandes a augmenté de près de 53 %. Le fait est que ce n’est pas négligeable.

La foule | jfgornet | CC by-sa

La foule | jfgornet | CC by-sa

De quoi justifier de freiner les ardeurs des usagers ? Pas si sûr.
Revenons tout d’abord aux termes de la loi 78-753 qui encadre l’exercice du droit d’accès. Tout d’abord, l’article 4 indique très clairement que les possibilités d’accès sont limitées par les possibilités techniques de l’administration. Autrement dit, si le nombre de demandes est tel que le service d’archives n’est pas en mesure de les traiter, ou que cela ne permet plus de mener à bien les autres missions, un service a la possibilité de limiter le libre accès.
Par ailleurs, l‘article 2 de cette même loi précise bien que l’administration n’est pas tenue de faire droit « aux demandes abusives par leur nombre, leur caractère répétitif ou systématique ».
Les services d’archives disposent donc déjà de deux leviers par lesquels il est possible de limiter le droit d’accès. Bien entendu, en cas de saisine de la CADA ou du tribunal administratif, l’administration doit être en mesure de prouver la réalité de ce qu’elle avance. Peut-être est-ce précisément ce qu’elle cherche à éviter.

Car la réalité des demandes par correspondance n’est pas celle que l’étude d’impact veut faire passer.
Les chiffres du SIAF ne sont pas suffisamment détaillés pour s’en convaincre. Je ne peux donc que m’appuyer sur mon expérience personnelle. Tous les services ont connu la même explosion du nombre de demandes par correspondance.
Mais cette augmentation est due en exclusivité à celle des demandes à caractère administratif, elle-même due exclusivement au versement des documents de la conservation des hypothèques.
Il y a bien eu transfert de la demande des usagers, mais uniquement en ce qui concerne les demandes administratives pour lesquelles il n’est pas prévu de limiter l’accès et qui représentent actuellement l’écrasante majorité des demandes.

Dans le même temps, le nombre de demandes à caractère généalogique ou historique s’est effondré, pour une raison très simple : nous numérisons et mettons en ligne un nombre de plus en plus important de documents. Les usagers n’ont plus besoin de nous demander des copies puisque nous les leur mettons à disposition.

La vérité est donc là. Nous, archivistes publics, sommes de plus en plus sollicités pour des demandes de communication à but administratif et juridique. Le meilleur moyen de diminuer les autres catégories de demandes n’est certainement pas de les refuser, mais plutôt de numériser les documents concernés et de les mettre en ligne. Une seule conclusion s’impose. Si les archivistes ne souhaitent plus traiter des demandes non administratives, il leur faut améliorer les conditions d’accès aux documents et non l’inverse. Notons au passage, encore une fois, que l’ouverture est bien vectrice de simplification administrative.

Récapitulons. Le projet de loi propose de restreindre le droit d’accès aux documents administratifs détenus par les services d’archives. Mais aucun des deux arguments avancés pour justifier cette restriction n’est valable.
Dans ce cas, quelle est la justification réelle de ce retour en arrière ? Elle est en fait très simple. L’objectif poursuivi est de permettre aux services d’archives de s’opposer à la réutilisation des informations publiques qu’ils détiennent sans avoir à se justifier. Nombre d’entre eux avaient tenté de le faire, avant que le juge ne les rappelle à la loi. La solution est donc toute trouvée : « puisque la loi ne nous convient pas, changeons la loi ».
Le fait de ne plus garantir le libre accès aux archives entraîne de facto l’impossibilité de garantir la libre réutilisation. Pas d’open data sans libre accès.
Mais faut-il rappeler que l’ouverture des données publiques est un enjeu de démocratie ? Faut-il rappeler qu’il s’agit là d’une demande exprimée par toutes les composantes de la société (citoyens, associations, entreprises, politiques) ? Faut-il rappeler enfin que la mission première des archivistes est de rendre l’information accessible ?
En cherchant à empêcher la réutilisation, les archivistes contreviennent à chacun de ces trois points. Ils reviennent sur un principe démocratique, s’opposent à une demande sociétale et renient l’essence même de leur métier.

Prison |  kIM DARam | CC by-nc

Prison | kIM DARam | CC by-nc

Par ailleurs, j’ai du mal à saisir la logique du législateur qui fait preuve d’une grande schizophrénie en retirant les archives du cadre de la loi Cada alors qu’en parallèle, il s’apprête à imposer l’open data aux collectivités.
Que dire également du ministère de la Culture, porteur de ce projet de loi, et qui a pourtant publié un rapport prônant « l’ouverture et le partage des données publiques culturelles » ?

Malgré des initiatives locales, les archives restent décidément le mouton noir de l’open data.

Domaine public et biens communs de la connaissance, un mémoire ENSSIB par Clément Tisserant

avril 9, 2014 dans Annonce

logo-enssib_0SavoirsCom1 salue le mémoire Domaine public et biens communs de la connaissance de Clément Tisserant qui porte sur la remise en cause de l’économie traditionnelle du savoir ainsi que sur l’activité du collectif.

Nous nous réjouissons de voir que la problématique du domaine public et des biens communs de la connaissance suscite un intérêt au sein des professionnels de l’information. Si la défense et la promotion des communs de la connaissance peuvent se faire à travers l’activité des bibliothécaires, il est aussi important d’accorder un espace de réflexion au domaine public durant leur formation.  Cela contribue notamment à la reconnaissance du domaine public.

Enfin, nous tenons à souligner la licence de son mémoire qui est placé sous Public Domain Mark. Il est directement accessible dans la bibliothèque numérique de l’ENSSIB.

Nous reproduisons ci-dessous le résumé du mémoire de Clément Tisserant

« Les nouvelles pratiques culturelles qui se développent dans l’environnement
numérique remettent en cause les modèles traditionnels de l’économie du savoir. Mais ce sont aussi les politiques publiques et la légitimité des bibliothèques qui sont interrogées. Fondé par deux bibliothécaires, le collectif SavoirsCom1 appelle de ses vœux la multiplication du partage de fichiers numériques au nom de la défense du «domaine public» et des «biens communs de la connaissance». Les débats suscités par leurs positions sont liés à la fois à la conception qu’ont les professionnels de leurs missions et à leur opinion sur les moyens de financement de la création et des institutions. »

La neutralité d’Internet : un bien commun reconnu au Parlement Européen

avril 3, 2014 dans Annonce

by Camilo Sanchez.

Le collectif SavoirsCom1 se réjouit de l’adoption d’une version amendée  du  rapport Pilar Del Castillo (Eurodéputée espagnole, et rapporteure du rapport, PPE, centre droit)  qui redéfinit et réaffirme la neutralité du réseau Internet.

On peut ainsi lire que la neutralité du réseau est « le principe selon lequel l’ensemble du trafic internet est traité de façon égale, sans discrimination, limitation ni interférence, indépendamment de l’expéditeur, du destinataire, du type, du contenu, de l’appareil, du service ou de l’application ».

Très concrètement, les fournisseurs d’accès à Internet ne pourront donc plus bloquer ou ralentir les services de leurs concurrents.

Ces amendements avaient été largement soutenus par La Quadrature du Net notamment.