A la suite de quelques réflexions intéressantes lancées par Manue du Figoblog et son geek éclairé et éclaireur du monde virtuel médiéviste, mais aussi de divers commentaires pertinents dans mon antépénultième note, je prolonge la discussion sur la numérisation des documents anciens, de l’illusion à la réalité.
D’abord et avant tout, il convient de dire que j’ai quelques titres pour parler de numérisation de manuscrits et d’archives, que ce soit par le biais de travaux systématiques menés à grande ou moyenne échelle par des collègues de mon équipe de recherche ou par moi-même, que ce soit par le biais d’une participation extérieure (comme « conseil ») à des expériences menées par d’autres équipes, ou enfin que ce soit par mes lectures personnelles. Je parle cependant à titre totalement personnel!
Avant tout, pour que les choses soient claires, distinguons entre les manuscrits, documents de type littéraire, contenant les oeuvres d’histoire ou de littérature, de prose ou de poésie…, conservés dans les bibliothèques… et les archives, documents de type normatif, d’administration, de gestion, qui attestent des droits, organisent la société, renforcent la cohérence sociale, politique, juridique, économique voire religieuse de cette société.
Comme l’affaire est d’importance et de taille, je scinde ma note en deux chapitres, le premier ci-dessous, le second dans un jour ou deux. L’un consacré à l’illusion de la panacée du « tout numérique » ; l’autre aux grandes avancées que le numérique induit et pourrait induire.
1. La Grande IIlusion de la numérisation.
Une anecdote: « on raconte » qu’un ministre d’un pays européen cher à mon coeur, en visite dans le principal dépôt d’archives publiques du pays, aurait lancé à la cantonnade d’archivistes larmoyant à juste titre sur le manque d’espace pour ranger les petits papiers dont ils avaient la charge: « moi, à votre place, je numériserais tout puis je jetterais les documents, ça vous ferait de la place! Vraie ou fausse, l’anecdote est significative: la numérisation semble, aux yeux de tous, être la panacée.
C’est une obsession bien ancienne… L’idée que reproduire un manuscrit permet de s’en passer presque définitivement est répandue depuis la fin des années ’30 du XXe s., lorsque le microfilm a été utilisé à large échelle pour reproduire des manuscrits, afin de permettre aux érudits de n’avoir plus à courir le monde pour établir les textes fondateurs de l’humanité. Très vite, de grandes collections de microfilms ont été mises en place, les unes par les bibliothèques elles-mêmes, les autres par des institutions scientifiques spécialisées.
Mais le microfilmage extensif, pas plus que la numérisation de masse, ne sont et ne seront jamais la panacée. Ils ne remplacent pas les éditions scientifiques rigoureuses, où l’on restitue des textes anciens à l’aide de dizaines de manuscrits criblés de variantes différentes, selon les copistes qui les ont transcrits. Le spécialiste cherchera au travers de tous ces manuscrits, par le biais de techniques très sophistiquées et presqu’ésotériques (ça s’appelle l’ecdotique), à reconstituer le texte original. J’ajoute qu’aucun système de base de données n’a permis, jusqu’ici, de suppléer à ces techniques avec les mêmes résultats.
La numérisation n’est pas la panacée parce qu’on aura toujours besoin de voir les manuscrits, leur texture, leur forme, leur reliure, le papier, l’encre, les dimensions exactes, les couleurs (piètrement rendues à l’heure actuelle par la numérisation), pour des recherches d' »archéologie du livre », entre autres.
Elle ne l’est pas parce qu’on ne pourra jamais, avec les moyens financiers actuels, procéder à une saisie numérique en prise directe sur les manuscrits: cela coûterait une fortune que les bibliothèques ne sont à l’heure actuelle plus prêtes à payer, sauf pour quelques opérations de prestige ou de sauvetage. D’autant plus que la plupart de ces manuscrits ont déjà fait l’objet d’une ou plusieurs campagnes de microfilmage: recommencer encore une campagne de numérisation « en prise directe » n’est pas, à l’heure actuelle, rentable du point de vue bibliothéconomique ni même scientifique.
Le jeu n’en vaut pas la chandelle! On numérisera donc… les microfilms, plus ou moins anciens, plus ou moins bien faits, plus ou moins usés, plus ou moins abîmés. A l’heure actuelle, les techniques de numérisation de microfilmage de masse existent, très chères. Le résultat dépend des exigences de départ quant à la qualité de la numérisation de ces microfilms (et donc de l’argent qu’on peut investir). Il dépend aussi très largement, on l’a compris, de la qualité des microfilms. Il dépend enfin des moyens humains mis à disposition pour indexer les prises numériques, leur accoler des métadonnées.
On me rétorquera, choqué: et ces magnifiques entreprises de numérisation d’images anciennes, d’enluminures de manuscrits, menées par des équipes de pointe avec du matériel de qualité, qui donnent déjà des résultats publiés sur le web ? C’est vrai, c’est vrai, superbe travail… mais pour suivre et aller encore plus loin que Manue dans son dernier commentaire à ma note, c’est une tout autre entreprise que de numériser « en masse » des manuscrits. Cette numérisation d’images est préparée minutieusement: on dépouille un manuscrit de 200 folios, on y choisit les miniatures et les enluminures importantes: 20, 10, 3, 1 folios sur l’ensemble… Pas question, pas plus pour les images que pour des numérisations « en masse » de manuscrits, d’utiliser le scanner « à plat »: de lourds bancs photos sont mis en place. Ce sont des spécialistes qui réalisent des clichés à très haute définition et en prise directe puis qui les « développent » (car, contrairement à l’idée reçue, une image numérique brute -en format RAW, le plus souvent- est inutilisable, elle doit faire l’objet de bien des traitements par des spécialistes de l’image). Ensuite, ces images sont revues et indexées avec des métadonnées en grand nombre par d’autres spécialistes des images médiévales. On ne peut numériser les manuscrits de la sorte, en prise directe, « en masse », à l’heure actuelle, avec le même degré de qualité, les mêmes traitements. C’est une question de moyens: il faudrait décupler les effectifs des équipes de photographes et de spécialistes de l’image, décupler les moyens financiers. Sans oublier les espaces de stockage qui doivent suivre… Or, pour l’instant, y’a pô d’sous pour ça. En tout cas, pas assez.
La numérisation n’est pas la panacée car, même si elle en venait à boucler la reprise de tous les microfilms déjà effectués, même si on accole à ces images de manuscrit les métadonnées nécessaires… ce ne seront jamais que les manuscrits médiévaux, pour l’essentiel, on s’arrêtera à 1550 environ… Les manuscrits modernes et contemporains, eux, beaucoup, beaucoup plus nombreux, restent à microfilmer et donc à numériser pour la plupart.
Enfin, la numérisation, s’agissant des archives anciennes, est un leurre. Car si on a microfilmé une grande partie des manuscrits des bibliothèques publiques de France, ce n’est pas le cas du tout pour les archives. On pourra donc numériser tous les manuscrits sur microfilms, mais pour les archives, il faudra repartir de zéro, des documents originaux. Seuls quelques fonds (voir ici -obtenu via l’essentiel Figoblog ;-)) ont été microfilmés et pourraient donc être traités, comme les registres paroissiaux d’avant 1800 ou les registres d’état-civil, pour nos p’tits potes les généalogistes. C’est le cas dans certains dépôts, comme celui de l’Aveyron : (voir ici ou ici). L’objectif: permettre aux généalogistes, LE public essentiel des dépôts d’archives, de consulter aisément ces documents essentiels à leur travail, sans souci et surtout sans risquer de les abîmer (vous devriez voir l’état des registres paroissiaux anciens non microfilmés après le passage de hordes et de hordes de généalogistes: Attila était un gamin à côté -j’ajoute que ce n’est pas nécessairement l’incurie des généalogistes qui est en cause, mais plutôt leur nombre…). Et encore, ces opérations salvatrices et efficaces coûtent terriblement cher: « 2 à 3 millions de pages pour les registres paroissiaux et d’état civil [d’un dépôt], par exemple, pour des montants pouvant dépasser le million d’euros » (Culture et recherche, 103, nov.-déc. 2004, p. 5). Les archives anciennes, médiévales, ne le seront jamais, sauf au coup par coup, par dossiers très ciblés et « porteurs » (tous les « cartulaires cisterciens », par exemple). Pourquoi ne traitera-t-on jamais numériquement, du moins pour l’instant, ces documents ? Simplement une question de rentabilité. Ces documents du XIIIe, XIVe, XVe s… ne sont consultés à l’heure actuelle que par deux, trois personnes par décennie, voire moins (ce n’est pas le cas pour les manuscrits « littéraires », bien plus consultés) : j’ai personnellement ouvert des dossiers et des chartes que personne n’avait vus depuis le XVIIIe s., depuis leur entrée dans le dépôt d’archives. On n’imagine donc pas consacrer des sommes démesurées pour numériser des séries d’archives que, peut-être, deux ou trois personnes seulement consulteront en vingt ans. Même si la numérisation devrait malgré tout faciliter la consultation et probablement au moins doubler le nombre de lecteurs, ce n’est pas suffisant… là aussi, le jeu n’en vaut pas la chandelle.
Envisager la numérisation comme la solution aux problèmes multiples que rencontrent bibliothèques et dépôts d’archives, pour l’instant, reste une utopie à court terme. Mais, pétri d’un optimisme confondant, je ne peux pas m’en tenir à ce constat dépité. La numérisation permet et permettra des avancées fulgurantes du point de vue scientifique ; je crois personnellement, malgré tout, à l’établissement de « bibliothèques virtuelles » dans une dizaine d’années. Mais j’en dirai plus dans le second chapitre… à suivre donc!