RECHERCHE :
Bienvenue sur le site de Michel VOLLE
Powered by picosearch  


Vous êtes libre de copier, distribuer et/ou modifier les documents de ce site, à la seule condition de citer la source.
 GNU Free Documentation License.

A propos de la numérisation des livres

22 mars 2005


Pour lire un peu plus :

- Consulter la BNF sur l'Internet
- Chirac veut concurrencer le moteur Google
- Gallica Classique
- Le projet Gutenberg

L’initiative de Google et la réaction de Jacques Chirac me rappellent une affaire ancienne.

Vers 1990, le projet architectural de la BNF était en cours. Il s’accompagnait d’un projet de numérisation des livres.

Pour numériser un livre, il faut le « scanner ». Cela procure une image que l’on pourra stocker et transmettre telle quelle. On peut également la soumettre à un logiciel de reconnaissance de caractères pour reconstituer le texte. Le texte, moins volumineux que l’image, se prête à l’indexation automatique et à la recherche en texte intégral mais ne conserve pas l’apparence physique du document original, le détail de sa mise en page etc. De plus la reconnaissance de caractères marche mal sur les ouvrages anciens, à la typographie dansante : il faut qu’elle soit vérifiée par un opérateur humain et c’est coûteux.

Le « scanning » était lui-même coûteux. Pour scanner des livres anciens, à la reliure fragile, il fallut construire des « scanners » spéciaux, présentant une surface de verre en forme de toit sur laquelle on pouvait poser un livre sans l’aplatir. Pour tourner les pages, il fallut construire des robots. Avec les ouvrages que la bibliothèque nationale possédait en plusieurs exemplaires, on pouvait massicoter un exemplaire pour le scanner feuille à feuille, ce qui équivalait bien sûr à le détruire.

Ces techniques passionnaient certains bibliothécaires. Mais j’avais autre chose en tête : la mise en réseau des ouvrages numérisés. France Telecom avait monté dans les années 80 des « partenariats Numéris » pour encourager la diversification des services télécoms utilisant un débit à 64 ou 128 kbit/s. L’Internet n’existait pas encore, ou du moins il n’était pas accessible comme aujourd’hui, mais Numéris permettait de télécharger assez confortablement les documents numérisés.

J’imaginais une bibliothèque numérique accessible via Numéris. On pouvait ouvrir la BNF sur le réseau avant que ses bâtiments ne fussent sortis de terre ! On pourrait mettre à disposition ce qui était libre de droits, c’est-à-dire toute la littérature classique soit plusieurs dizaines de milliers de volumes, alors qu’une bonne bibliothèque familiale n'en compte au plus que quelques milliers. J’imaginais une campagne d’affichage dans le métro : « La BNF est ouverte, venez la consulter sur Numéris ! » - et, naïvement sans doute, j’anticipais la ruée des lecteurs…

Nous avons eu des réunions avec les gens de la BNF. J’ai oublié leurs noms, paix à leurs cendres. L’évocation d’une BNF en réseau, loin d’éveiller leur enthousiasme, a rencontré ce regard rêveur qui indique que le consultant a tapé à côté de la plaque. Lorsque vous êtes pénétré par une évidence, ce regard vous incite à vous demander si c'est vous qui êtes fou, ou les autres.

C’est que nous n’avions pas la même conception de la lecture et de la bibliothèque. Pour les gens de la BNF, le Livre était un objet sacré. Pour pouvoir le toucher, le lecteur devait entrer dans la Bibliothèque, s’agenouiller symboliquement devant le Bibliothécaire et obéir à la liturgie maison : remplissage de la fiche, attente, enfin remise délicate de l'ouvrage pour un court délai. L’accès à distance, sans cérémonial, était une proposition hérétique qu'il convenait d'accueillir par un regard absent suivi d’un rappel à l’ordre du jour.

Lorsque je schématise de la sorte, on dira que je caricature, que « ce n’est pas si simple ». Sans doute il existait, à la BNF, bien des conceptions différentes de la bibliothèque : la France n’est-elle pas le pays de la diversité ? Mais la caricature est utile lorsqu’elle révèle, en les accentuant, des choses que masque la banalité du quotidien.

Mettre la BNF en réseau sur Numéris, cela n’aurait été bien sûr qu’une solution transitoire : l’Internet, combiné au progrès des modems, a facilité l'accès aux documents numérisés que l’ADSL a encore amélioré. Mais si l’on avait ouvert cet accès dès le début des années 90, cela aurait introduit de nouvelles habitudes, de nouvelles pratiques de lecture et de consultation. Nous ne serions pas aujourd’hui à la traîne de Google.

Il en est de même avec le Plan Câble des années 80. Équiper de fibre optique le réseau de distribution, cela aurait posé des problèmes par la suite vu l’évolution des techniques optiques ; mais cela aurait aussi enclenché, autour de la consommation audiovisuelle, de nouveaux partenariats, de nouveaux marchés, de nouvelles formes de consommation et de tarification. On ne peut pas refaire l’histoire mais les choses auraient bougé, et c’est cela que les gens « raisonnables » ont refusé, ces gens qui ont enterré et ridiculisé le Plan Câble.

Revenons aux livres. La BNF a mis en ligne le stock des ouvrages numérisés : on peut les consulter à l’adresse http://gallica.bnf.fr/classique/. 1 200 sont en mode texte[1], 70 000 en mode image et ce sont les plus émouvants : il est magnifique de pouvoir lire les Essais de Montaigne dans leur typographie et leur mise en page originales ! Des liens vers d’autres bibliothèques offrent des découvertes au curieux.

Les réticences « culturelles » à propos de la mise en réseau ont eu cependant la vie dure : le serveur de Gallica est longtemps resté sous-dimensionné et il fallait s’y prendre à plusieurs reprises pour télécharger un livre (voir Consulter la BNF sur l'Internet). Cela marche mieux maintenant, même si le service n'est pas des plus commodes. Mais Gallica reste peu connu et relativement peu fréquenté. La BNF n’a pas fait de campagne d’affichage dans le métro - et un stock de 70 000 livres, ce n'est pas beaucoup si l'on pense que sa saisie s'est étalée sur plus de dix ans.

C’est ainsi que le projet de Google apparaît comme une immense nouveauté face à laquelle il convient que l’Europe se mobilise. Il aura fallu un délai de quinze ans, plus une initiative américaine provocante, pour qu’une évidence devienne enfin perceptible. Une évidence non pas technique, non pas réservée aux spécialistes, mais pratique et accessible à quiconque accepterait de désarmer ses préjugés, d’écouter pendant quelques minutes, puis de réfléchir.

Désarmer des préjugés ! Écouter ! Réfléchir ! Ce n’est pas ainsi que les choses se passent chez nous...


[1] La reconnaissance de caractères n’a donc pas été utilisée de façon intensive.