Au fil de mes réflexions sur l'archivage pérenne des données numériques, ce tweet a tout relancé, bousculant mes idées.
La mise en place de la plupart des projets de recherche -ou de tout site web, ou de toute publication web de corpus- impose que soit envisagée des procédures fermes d'archivage pérenne. Or nous savons que ces procédures, même si elles sont susceptibles d'exister, exigent des supports techniques et intellectuels démesurés par rapport aux capacités actuelles, notamment en SHS, tandis que les moyens financiers alloués pour ce faire ne vont pas aller en s'accroissant, fort logiquement. En d'autres termes : nous rêvons d'archivage pérenne, nous en hurlons la nécessité évidente et nous sommes incapables de l'assurer. Et je ne vois pas pourquoi ça changerait fortement (même si le coût du TéraOctet diminue, ce n'est qu'une part des procédures d'archivage pérenne qui englobent frais de maintenance, procédures de transfert de données de serveur en serveur, changements logiciels…).
Par ailleurs, on sait que, de toute éternité, la documentation humaine est soumise à des processus de destruction et d'élimination volontaires (on pense à la destruction -très partielle?- d’une bibliothèque de manuscrits à Tombouctou il y a quelques jours) ou involontaires (l’écroulement du bâtiment des archives de Cologne en 2009). Ces destructions sont normales. Parfois les archivistes ou les bibliothécaires eux-mêmes pratiquent l'art du « désherbage » ou de la sélection pour destruction ou conservation. J'ai moi-même en son temps poussé des brouettes d'archives judiciaires du XIXe s. dans des conteneurs pour le pilon.
Et si nous appliquions ces principes de sélection aux résultats de la recherche en numérique, voire aux sources numériques ? S'il n'était pas nécessaire de mettre en place des procédures d'archivage pérenne pour tout ? Si on ajoutait une terrible mais salutaire contrainte aux projets de recherche en cours de rédaction ou de proposition : choisir d'emblée, dans le projet qui est mis au concours, ce qui doit être conservé des travaux qui seront réalisés et ce qui ne doit pas l'être. Ce qui doit faire l'objet d'archivage pérenne et ce qui ne le sera pas. C’est probablement dans ces quelques lignes que les experts chargés de juger de la pertinence d’un projet pourraient évaluer le plus justement la réelle vision scientifique du chercheur, la compréhension de son objet de recherche.