← Retour

Les mutations du livre

16px
100%

L'idée du site internet vient d'Hervé Le Crosnier, enseignant à l'Université de Caen et modérateur de la liste de diffusion Biblio-fr, qui monta sur le serveur de l'université la maquette d'un site possible pour la Bibliothèque municipale de Lisieux, afin que je puisse en faire la démonstration à mes élus. La suite logique en a été le vote au budget primitif de 1996 d'un crédit pour l'ouverture d'une petite salle multimédia avec accès public au réseau pour les Lexoviens (habitants de Lisieux, ndlr). Depuis cette date un crédit d'entretien pour la mise à niveau des matériels informatiques est alloué au budget de la bibliothèque qui permettra cette année la montée en puissance des machines, l'achat d'un graveur de cédéroms et la mise à disposition d'une machine bureautique pour les lecteurs de l'établissement…. ainsi que la création en ce début d'année d'un emploi jeune pour le développement des nouvelles technologies.»

En juillet 1999, 370 oeuvres sont disponibles en ligne. A la même date, Olivier Bogros explique: «Les oeuvres à diffuser sont choisies à partir d'exemplaires conservés à la Bibliothèque municipale de Lisieux ou dans des collections particulières mises à disposition. Les textes sont saisis au clavier et relus par du personnel de la bibliothèque, puis mis en ligne après encodage. La mise à jour est mensuelle (3 à 6 textes nouveaux). Par goût, mais aussi contraints par le mode de production, nous sélectionnons plutôt des textes courts (nouvelles, brochures, tirés à part de revues, articles de journaux…). De même nous laissons à d'autres (bibliothèques ou éditeurs) le soin de mettre en ligne les grands classiques de la littérature française, préférant consacrer le peu de temps et de moyens dont nous disposons à mettre en ligne des textes excentriques et improbables. (…) Nous réfléchissons aussi, dans le domaine patrimonial, à un prolongement du site actuel vers les arts du livre - illustration, typographie… - toujours à partir de notre fonds. Sinon, pour ce qui est des textes, nous allons vers un élargissement de la part réservée au fonds normand.»

L'année 2000 marque le début du partenariat de la Bibliothèque électronique de Lisieux avec l'Université de Toronto. Lancé officiellement en août 2000, LexoTor est une base de données utilisant le logiciel TACTweb (TACT: text analysis computing tools) et permettant l'interrogation en ligne des oeuvres de la bibliothèque, ainsi que des analyses et des comparaisons textuelles. Le projet est issu de la rencontre d'Olivier Bogros avec Russon Wooldridge, professeur au département d'études françaises de l'Université de Toronto, lors d'un colloque organisé par ce dernier en mai 2000 à Toronto («colloque international sur les études françaises valorisées par les nouvelles technologies d'information et de communication»). Deux ans après, en mai 2002, un deuxième colloque international sur le même sujet est organisé cette fois par Olivier Bogros à Lisieux.

En septembre 2003, la bibliothèque électronique approche les 600 textes. En décembre 2006, les collections comprennent 930 oeuvres et 20 galeries d'images, le tout représentant 327,1 Mo (mégaoctets) sur une capacité de stockage de 600 Mo.

= Gallica

Secteur numérique de la Bibliothèque nationale de France (BnF), Gallica est inauguré en 1997 avec des images et textes du 19e siècle francophone, «siècle de l'édition et de la presse moderne, siècle du roman mais aussi des grandes synthèses historiques et philosophiques, siècle scientifique et technique». A l'époque, le serveur stocke 2.500 livres numérisés en mode image complétés par les 250 volumes numérisés en mode texte de la base Frantext de l'INaLF (Institut national de la langue française). Classées par discipline, ces ressources sont complétées par une chronologie du 19e siècle et des synthèses sur les grands courants en histoire, sciences politiques, droit, économie, littérature, philosophie, sciences et histoire des sciences. Le site propose aussi un échantillon de la future iconothèque numérique, à savoir le fonds du photographe Eugène Atget, une sélection de documents sur l'écrivain Pierre Loti, une collection d'images de l'Ecole nationale des ponts et chaussées sur les grands travaux liés à la révolution industrielle en France, et enfin un choix de livres illustrés de la Bibliothèque du Musée de l'homme.

Fin 1997, Gallica se considère moins comme une banque de données numérisées que comme un «laboratoire dont l'objet est d'évaluer les conditions d'accès et de consultation à distance des documents numériques». Le but est d'expérimenter la navigation dans ces collections, en permettant aussi bien le libre parcours du chercheur ou du curieux que des recherches textuelles pointues.

Début 1998, Gallica annonce 100.000 volumes et 300.000 images pour la fin 1999, avec un accroissement rapide des collections ensuite. Ces collections numériques pourront également être consultées sur place à la BnF au moyen de 3.000 postes multimédias, dont quelques centaines fonctionnent déjà début 1998. Sur les 100.000 volumes prévus, qui représenteront 30 millions de pages numérisées, plus du tiers concerne le 19e siècle. Quant aux 300.000 images fixes, la moitié appartient aux départements spécialisés de la BnF (Estampes et photographie, Manuscrits, Arts du spectacle, Monnaies et médailles, etc.). L'autre moitié provient de collections d'établissements publics (musées et bibliothèques, Documentation française, Ecole nationale des ponts et chaussées, Institut Pasteur, Observatoire de Paris, etc.) ou privés (agences de presse dont Magnum, l'Agence France-Presse, Sygma, Rapho, etc.).

Par ailleurs, à la même date, le site bilingue français-anglais de la BnF est à la fois solidement ancré dans le passé et résolument ouvert sur l'avenir, comme en témoigne le menu principal de la page d'accueil avec ses neuf rubriques: nouveau (à savoir les nouvelles manifestations culturelles), connaître la BnF, les actualités culturelles, les expositions virtuelles (quatre expositions en septembre 1998: les splendeurs persanes, le roi Charles V et son temps, naissance de la culture française, tous les savoirs du monde), des informations pratiques, l'accès aux catalogues de la BnF, l'information professionnelle (conservation, dépôt légal, produits bibliographiques, etc.), la bibliothèque en réseau (Francophonie, coopération nationale, coopération internationale, etc.), et les autres serveurs (bibliothèques nationales, bibliothèques françaises, universités, etc.). Enfin, bien en vue sur la page d'accueil, un logo permet d'accéder à Gallica.

En mai 1998, la BnF revoit ses espérances à la baisse et modifie quelque peu ses orientations premières. Jérôme Strazzulla, journaliste, écrit dans Le Figaro du 3 juin 1998 que la BnF est «passée d'une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus». Dans le même article, le président de la BnF, Jean-Pierre Angremy, rapporte la décision du comité éditorial de Gallica: «Nous avons décidé d'abandonner l'idée d'un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd'hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. (…) Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs.» Le premier corpus aura trait aux voyages en France, avec mise en ligne prévue en 2000. Ce corpus rassemblera des textes, estampes et photographies du 16e siècle à 1920. Les corpus envisagés ensuite sont : Paris, les voyages en Afrique des origines à 1920, les utopies, et les mémoires des Académies des sciences de province.

En 2003, Gallica donne accès à tous les documents libres de droit du fonds numérisé de la BnF, à savoir 70.000 ouvrages et 80.000 images allant du Moyen-Age au début du 20e siècle. Mais, de l'avis de nombreux usagers, les fichiers sont très lourds puisque les livres sont numérisés en mode image, et l'accès en est très long. Chose tout aussi problématique, la numérisation en mode image n'autorise pas la recherche textuelle alors que Gallica se trouve être la plus grande bibliothèque numérique francophone du réseau en nombre de titres disponibles en ligne. Seule une petite collection de livres (1.117 titres en février 2004) est numérisée en mode texte.

En février 2005, Gallica compte 76.000 ouvrages. A la même date, la BnF annonce la mise en ligne prochaine (entre 2006 et 2009) de la presse française parue entre 1826 et 1944, à savoir 22 titres représentant 3,5 millions de pages. Début 2006, les premiers journaux disponibles en ligne sont Le Figaro (fondé en 1826), La Croix (fondée en 1883), L'Humanité (fondée en 1904) et Le Temps (fondé en 1861 et disparu en 1942). En décembre 2006, les collections comprennent 90.000 ouvrages numérisés (fascicules de presse compris), 80.000 images et des dizaines d'heures de ressources sonores. Gallica débute la conversion en mode texte des livres numérisés en mode image pour pour favoriser l'accès à leur contenu.

= Online Books Page

Certains se donnent pour tâche non pas de numériser des oeuvres mais, tout aussi utile, de répertorier celles qui sont en accès libre sur le web, en offrant au lecteur un point d'accès commun. C'est le cas de John Mark Ockerbloom, doctorant à l'Université Carnegie Mellon (Pittsburgh, Pennsylvanie, Etats-Unis), qui crée l'Online Books Page pour recenser les oeuvres anglophones.

Cinq ans plus tard, en septembre 1998, il relate: «J'étais webmestre ici pour la section informatique de la CMU (Carnegie Mellon University), et j'ai débuté notre site local en 1993. Il comprenait des pages avec des liens vers des ressources disponibles localement, et à l'origine l'Online Books Page était l'une de ces pages, avec des liens vers des livres mis en ligne par des collègues de notre département (par exemple Robert Stockton, qui a fait des versions web de certains textes du Projet Gutenberg). Ensuite les gens ont commencé à demander des liens vers des livres disponibles sur d'autres sites. J'ai remarqué que de nombreux sites (et pas seulement le Projet Gutenberg ou Wiretap) proposaient des livres en ligne, et qu'il serait utile d'en avoir une liste complète qui permette de télécharger ou de lire des livres où qu'ils soient sur l'internet. C'est ainsi que mon index a débuté. J'ai quitté mes fonctions de webmestre en 1996, mais j'ai gardé la gestion de l'Online Books Page, parce qu'entre temps je m'étais passionné pour l'énorme potentiel qu'a l'internet de rendre la littérature accessible au plus grand nombre. Maintenant il y a tant de livres mis en ligne que j'ai du mal à rester à jour. Je pense pourtant poursuivre cette activité d'une manière ou d'une autre. Je suis très intéressé par le développement de l'internet en tant que médium de communication de masse dans les prochaines années. J'aimerais aussi rester impliqué dans la mise à disposition gratuite de livres sur l'internet, que ceci fasse partie intégrante de mon activité professionnelle, ou que ceci soit une activité bénévole menée sur mon temps libre.»

Fin 1998, John Mark Ockerbloom obtient son doctorat en informatique. En 1999, il rejoint l'Université de Pennsylvanie, où il travaille à la R&D (recherche et développement) de la bibliothèque numérique de l'université. A la même époque, il y transfère l'Online Books Page, tout en gardant la même présentation, très sobre, et il poursuit son travail d'inventaire dans le même esprit. Ce répertoire recense 20.000 textes électroniques en septembre 2003 et 25.000 textes électroniques en décembre 2006.

Une autre initiative est celle de l'Internet Public Library (IPL). Créée en mars 1995 par l'Université du Michigan (Etats-Unis) dans le cadre de la School of Information and Library Studies, l'IPL se définit comme la première bibliothèque publique de l'internet sur l'internet, à savoir une bibliothèque sélectionnant, organisant et cataloguant les ressources disponibles sur l'internet, et n'existant elle-même que sur celui-ci. Cette bibliothèque publique d'un genre nouveau devient vite une référence. L'IPL recense de manière pratiquement exhaustive les livres (Online Texts, avec 22.500 titres en 2006), les journaux (Newspapers) et les magazines (Magazines) disponibles sur le web. Les livres sont essentiellement des oeuvres du domaine public.

7.2. Bibliothèques traditionnelles

Qu'en est-il de l'internet dans les bibliothèques traditionnelles? La première bibliothèque présente sur le web est la Bibliothèque municipale d'Helsinki (Finlande), qui inaugure son site en février 1994. Des bibliothèques mettent sur pied des «cyberespaces» à destination de leurs lecteurs. D'autres bibliothèques font connaître les joyaux de leurs collections par le biais du web. Des bibliothèques nationales unissent leurs efforts pour créer un portail commun. Voici un récit succint de quelques réalisations très différentes.

= ARPALS, en milieu rural

Lancé en 1996, le site web de l'ARPALS a pour sous-titre: «Internet et multimédia aux champs, ou comment amener la culture en milieu rural». L'ARPALS (Amicale du regroupement pédagogique Armillac Labretonie Saint-Barthélémy) regroupe les 950 habitants de quatre villages (Armillac, Labretonie, Laperche et Saint-Barthélémy) sis dans le département du Lot-et-Garonne, dans le sud-ouest de la France. Le regroupement pédagogique intercommunal (RPI) permet aux quatre villages de faire école commune afin d'éviter la fermeture de classes malheureusement fréquente en zone rurale.

L'ARPALS met sur pied d'une part des animations (repas, kermesse, bal masqué), d'autre part une bibliothèque intercommunale de 1.300 livres en partenariat avec la Bibliothèque départementale de prêt (BDP) de Villeneuve-sur-Lot. Le site web présente une sélection de livres avec un résumé pour chacun d'eux. L'association crée aussi une médiathèque ouverte 22 heures par semaine pour un public allant de 3 à 76 ans. Quatre ordinateurs multimédias - complétés par deux imprimantes couleur et un scanner à plat - permettent la consultation de CD-Rom, le libre accès à l'internet et l'utilisation de logiciels bureautiques tels que Works, Dbase for Windows, Corel Draw, Publisher, PhotoPaint, etc.

En juin 1998, Jean-Baptiste Rey, webmestre de l'ARPALS, précise: «Le but de notre site internet est de faire connaître l'existence de la médiathèque intercommunale de Saint-Barthélémy et ce que nous y faisons. C'est un moyen pour nous de démontrer l'utilité et l'intérêt de ce type de structure et la simplicité de l'usage des nouvelles technologies dans le cadre d'une bibliothèque. » C'est aussi un moyen de « pallier la faiblesse de notre fonds documentaire. Internet et le multimédia nous permettent d'offrir beaucoup plus de ressources et d'informations à nos usagers.»

= Cyberespace des Nations Unies

L'internet peut aussi relancer les bibliothèques traditionnelles. C'est le cas de la Bibliothèque de l'Organisation des Nations Unies à Genève (ONUG), sise dans l'imposant Palais des Nations, entre le Lac Léman et le quartier des organisations internationales.

En juillet 1997, à l'initiative de Pierre Pelou, son directeur, la bibliothèque ouvre un cyberespace de 24 postes informatiques en libre accès avec plusieurs dizaines de CD-Rom en réseau et connexion à l'internet. Aménagé au premier étage de la bibliothèque par Antonio Bustamante, architecte au Palais des Nations, ce cyberespace est mis gratuitement à la disposition des représentants des missions permanentes, délégués de conférences, fonctionnaires internationaux, chercheurs, étudiants, journalistes, membres des professions libérales, ingénieurs et techniciens, sans sélection par le rang, chose assez rare dans ce milieu. Le premier arrivé est le premier servi.

Les 24 stations du cyberespace comprennent chacune un ordinateur multimédia, un lecteur de CD-Rom et un casque individuel. Chaque groupe de trois ordinateurs est relié à une imprimante laser. Chaque station permet de consulter l'internet et sa messagerie électronique et d'utiliser le traitement de texte WordPerfect. Sont disponibles aussi les services suivants: 1) le système optique des Nations Unies; 2) un serveur regroupant une cinquantaine de CD-Rom en réseau; 3) la banque de données UNBIS (United Nations Bibliographic Information System), coproduite par les deux bibliothèques des Nations Unies à New York et à Genève; 4) le catalogue de la Bibliothèque de l'Office des Nations Unies à Genève; 5) Profound, un ensemble de banques de données économiques et commerciales; 6) RERO, le catalogue du Réseau romand des bibliothèques suisses (qui comprend le catalogue de la Bibliothèque des Nations Unies de Genève à titre de bibliothèque associée); 7) plusieurs CD-Rom multimédia (Encarta 97, L'Etat du monde, Elysée 2, Nuklear, etc.); 8) des vidéocassettes multistandards et des DVD présentant des programmes, films et documentaires sur l'action internationale et l'action humanitaire.

Très rapidement, de l'avis du personnel, «la consultation électronique induit une plus grande consultation imprimée et un renforcement de toutes les formes de recherche». Dépassant les prévisions les plus optimistes, ce cyberespace joue le rôle de catalyseur, amenant un public nouveau, jeune, varié et enthousiaste à consulter les collections de la bibliothèque et à utiliser ses autres services. Suite au succès du premier cyberespace, un deuxième cyberespace ouvre en avril 1998, deux étages plus haut, avec six postes informatiques et une vue imprenable sur le lac Léman et la chaîne des Alpes.

= Enluminures de la Bibliothèque de Lyon

Nombre de bibliothèques recèlent des joyaux que l'internet permet de faire connaître. C'est le cas de la Bibliothèque municipale de Lyon qui, en 1998, décide de diffuser en ligne sa collection d'enluminures, en débutant par une collection numérique de 3.000 images, le but à terme étant une collection de 10.000 images émanant de 200 manuscrits et incunables s'échelonnant du 5e siècle à la Renaissance. Le système utilisé est le SGBI (Système de gestion de banques d'images) créé par la Maison de l'Orient à Lyon, sous l'égide du CNRS (Centre national de la recherche scientifique) et de l'Université Lyon 2.

«Chaque document, signalé par son auteur, son titre et son siècle de réalisation, représente une entité, est-il expliqué sur le site web. Par un double clic sur l'entité choisie, on accède à un écran qui permet de feuilleter les images du document. Chaque écran peut comporter neuf imagettes, correspondant à des objets-images. Lorsque le document comporte davantage d'objets-images, des flèches permettent d'accéder aux objets-images suivants. Chaque objet-image peut comprendre plusieurs images, leur nombre étant indiqué sous chaque objet-image. Un double-clic sur une imagette permet de voir l'image agrandie. Dans une seconde étape, une interrogation multicritères sera possible.»

Deux ans plus tard, en décembre 2000, le site web donne accès à la plus importante collection française d'enluminures médiévales, soit 12.000 images scannées dans 457 ouvrages précieux. Certains manuscrits et incunables sont à dominante religieuse: bibles, missels, bréviaires, pontificaux, livres d'heures, droit canon. D'autres, à dominante profane, traitent de philosophie, d'histoire, de littérature, de sciences, etc. Les images numérisées sont les peintures en pleine page et les miniatures, ainsi que les initiales ornées et les décors des marges.

La bibliothèque poursuit ensuite la numérisation de ses collections iconographiques. Début 2003, plusieurs fonds spécialisés sont en accès libre sur le web: manuscrits, livres imprimés anciens, manuscrits autographes, collections locales (Lyon) et régionales (Rhône-Alpes), ésotérisme et franc-maçonnerie, fonds de la première guerre mondiale (1914-1918), estampes, affiches, livres d'artistes, photographies, fonds Lacassagne (père de l'Ecole lyonnaise d'anthropologie criminelle), fonds chinois, arts du spectacle, et enfin collection jésuite des Fontaines.

= Gabriel, serveur européen

Lancé en 1997, Gabriel - acronyme de: Gateway and Bridge to Europe's National Libraries - est le serveur des bibliothèques nationales européennes, créé pour offrir un point d'accès unique à leurs services et collections. Le choix de ce nom «rappelle également les travaux de Gabriel Naudé, dont l'Advis pour dresser une bibliothèque (Paris, 1627) est le premier travail théorique en Europe sur les bibliothèques et qui constitue ainsi un point de départ sur les bibliothèques de recherche modernes. Le nom Gabriel est aussi employé dans de nombreuses langues européennes et vient de l'Ancien Testament, Gabriel étant l'un des archanges, ou messager céleste. Il est également présent dans le Nouveau Testament et dans le Coran.»

Plus prosaïquement, le site trilingue (anglais, français, allemand) propose des liens hypertextes vers les services en ligne d'un certain nombre de bibliothèques nationales (Allemagne, Autriche, Belgique, Bulgarie, Danemark, Espagne, Estonie, Finlande, France, Grèce, Hongrie, Irlande, Islande, Italie, Lettonie, Liechtenstein, Lituanie, Luxembourg, Macédoine, Malte, Norvège, Pays-Bas, Pologne, Portugal, République slovaque, République tchèque, Roumanie, Royaume-Uni, San Marino, Suède, Suisse, Turquie et Vatican). Une rubrique informe des projets communs à plusieurs pays. La recherche sur Gabriel est possible par pays ou par type de services: OPAC (online public access catalogue), bibliographies nationales, catalogues collectifs nationaux, index de périodiques, serveurs web, gophers (à savoir des systèmes d'information à base de menus textuels à plusieurs niveaux), liste complète des services en ligne par bibliothèque.

Comment Gabriel voit-il le jour? L'idée d'un site web commun aux bibliothèques nationales européennes naît en 1994 à Oslo (Norvège) lors de la réunion annuelle de la CENL (Conference of European National Librarians). En mars 1995, une nouvelle réunion rassemble les représentants de la Koninklijke Bibliotheek (Pays-Bas), de la British Library (Royaume-Uni) et de l'Helsinki University Library (Finlande). Après s'être mises d'accord sur un projet pilote, ces trois bibliothèques sont rejointes par trois autres bibliothèques nationales: Die Deusche Bibliothek (Allemagne), la Bibliothèque nationale de France et la Biblioteka Narodowa (Pologne).

Le projet Gabriel est approuvé en septembre 1995 lors de la réunion annuelle de la CENL à Berne (Suisse). Un serveur pilote est lancé sur l'internet par la British Library, qui s'occupe ensuite de sa maintenance éditoriale avec la collaboration des Bibliothèques nationales de Finlande et des Pays-Bas. La seconde étape se déroule entre octobre 1995 et septembre 1996. Les bibliothèques nationales n'ayant pas participé à la phase pilote sont invitées à se joindre au projet. Entre-temps, nombre de bibliothèques nationales débutent leur propre site web. Lors de sa réunion à Lisbonne (Portugal) en septembre 1996, la CENL décide de lancer officiellement Gabriel à compter du 1er janvier 1997, la maintenance éditoriale étant assurée par la Bibliothèque nationale des Pays-Bas.

En été 2005, Gabriel est intégré à la Bibliothèque européenne. Lancée dix-huit mois plus tôt, en janvier 2004, la Bibliothèque européenne est issue du projet TEL (Telematics & Electronic Libraries), un projet subventionné par la Commission européenne pendant trois ans, entre 2001 et 2003, pour étudier la faisabilité d'un service pan-européen donnant accès aux ressources disséminées dans toutes les bibliothèques nationales d'Europe. Ce portail commun est mis en ligne par la CENL et hébergé par la Bibliothèque nationale des Pays-Bas. Il offre un point d'accès unique aux catalogues de 18 bibliothèques nationales (Allemagne, Autriche, Croatie, Danemark, Estonie, Finlande, France, Italie, Hongrie, Lettonie, Pays-Bas, Portugal, République tchèque, Royaume-Uni, Serbie, Slovaquie, Slovénie et Suisse), avec accès (gratuit ou payant) aux documents électroniques de ces bibliothèques. S'y ajoutent les catalogues de la CENL et de l'ICCU (Instituto Centrale per il Catalogo Unico delle Bibliothece Italiane). Les collections des 25 autres bibliothèques nationales seront intégrées dans une phase ultérieure. La Bibliothèque européenne devrait également accueillir en son sein la future Bibliothèque numérique européenne, nouveau projet officiellement lancé en mars 2006.

= De la conservation à la communication

Face à un web encyclopédique et des bibliothèques numériques de plus en plus nombreuses, les jours des bibliothèques traditionnelles sont-ils comptés? La bibliothèque numérique menace-t-elle vraiment l'existence de la bibliothèque traditionnelle? En 1997 et 1998, plusieurs grandes bibliothèques expliquent sur leur site que, à côté d'un secteur numérique en pleine expansion, la communication physique des documents reste essentielle. Ces commentaires ont depuis disparu. La bibliothèque numérique rend enfin compatibles deux objectifs qui ne l'étaient guère, à savoir la conservation des documents et leur communication. Le document est numérisé une bonne fois pour toutes, et le grand public y a facilement accès. Au début des années 2000, toute bibliothèque traditionnelle quelque peu dynamique dispose de collections numériques, soit à usage interne, soit en accès libre sur le web.

Les problèmes de bande passante s'estompent aussi. Après avoir proposé avec enthousiasme des images en pleine page très agréables à l'oeil mais excessivement longues à apparaître à l'écran, nombreux sont les sites qui optent ensuite pour des images de format réduit, avec possibilité de cliquer ou non sur ces images pour obtenir un format plus grand. Cette présentation est souvent restée la norme, même avec la généralisation de l'internet à débit rapide. Le passage du petit format ou grand format est désormais rapide sinon immédiat, à la grande satisfaction des iconographes, photographes et autres amateurs d'images.

La raison d'être des bibliothèques nationales est de préserver un patrimoine accumulé au fil des siècles : manuscrits, incunables, livres imprimés, journaux, périodiques, gravures, affiches, partitions musicales, images, photos, films, etc. Ceci n'est pas près de changer. Si le fait de disposer de supports numériques favorise la communication, il faut bien un endroit pour stocker les documents physiques originaux, à commencer par les Bibles de Gutenberg.

Les bibliothèques nationales archivent d'ailleurs aussi les documents électroniques et les pages web. A la Bibliothèque nationale de France (BnF) par exemple, il a été décidé de collecter et d'archiver les sites dont le nom de domaine se termine en .fr, ou encore les sites dédiés aux campagnes électorales, d'abord pour les présidentielles de 2002, puis pour les législatives de 2004, et enfin pour les présidentielles et les législatives de 2007, en archivant et collectant les sites institutionnels, les sites et blogs officiels des candidats, les sites d'analyses, les sites des médias traditionnels, les sites d'associations et de syndicats, etc.

Les bibliothèques publiques ne semblent pas près de disparaître non plus. Malgré la curiosité suscitée par le livre numérique, les lecteurs assurent le plus souvent qu'ils ne sont pas prêts à lire Zola ou Proust à l'écran. Question de génération peut-être. Les enfants ayant appris à lire directement à l'écran ne verront peut-être aucun problème à lire des livres en ligne sur des supports électroniques en tous genres.

Si les bibliothèques nationales et les bibliothèques publiques restent toujours utiles, la situation est différente pour les bibliothèques spécialisées. Dans nombre de domaines où l'information la plus récente est primordiale, on s'interroge maintenant sur la nécessité d'aligner des documents imprimés sur des rayonnages, alors qu'il est tellement plus pratique de rassembler, stocker, archiver, organiser, cataloguer et diffuser des documents électroniques, et de les imprimer seulement à la demande.

7.3. Du bibliothécaire au cyberthécaire

En trois décennies, le bibliothécaire-documentaliste a vu son activité professionnelle frappée de plein fouet par l'informatique puis par l'internet. Comment la transition s'est-elle passée ?

= Bibliothécaires et internet

Selon Olivier Bogros, directeur de la Bibliothèque municipale de Lisieux (Normandie), interviewé en juin 1998, l'internet est «un outil formidable d'échange entre professionnels (tout ce qui passe par le courrier électronique, les listes de diffusion et les forums) (…). C'est aussi pour les bibliothèques la possibilité d'élargir leur public en direction de toute la Francophonie. Cela passe par la mise en ligne d'un contenu qui n'est pas seulement la mise en ligne du catalogue, mais aussi et surtout la constitution de véritables bibliothèques virtuelles.»

L'internet est un outil de communication sans précédent. La liste de diffusion Biblio-fr est créée en 1993 par Hervé Le Crosnier, professeur à l'Université de Caen (Normandie) à l'intention des «bibliothécaires et documentalistes francophones et [de] toute personne intéressée par la diffusion électronique de l'information documentaire». La liste se veut le regard francophone des documentalistes sur les questions soulevées par le développement de l'internet, par exemple «la diffusion de la connaissance, l'organisation de collections de documents électroniques, la maintenance et l'archivage de l'écrit électronique». Biblio-fr compte 3.329 abonnés le 20 décembre 1998 et 15.136 abonnés le 20 avril 2007. Une autre liste de diffusion est ADBS-info, gérée par l'Association des professionnels de l'information et de la documentation (ADBS), avec 7.699 abonnés le 20 avril 2007.

Des portails sont créés à l'intention des bibliothèques, par exemple Biblio On Line. Jean-Baptiste Rey, son rédacteur et webmestre, relate en juin 1998: «Le site dans sa première version a été lancé en juin 1996. Une nouvelle version (l'actuelle) a été mise en place à partir du mois de septembre 1997. Le but de ce site est d'aider les bibliothèques à intégrer internet dans leur fonctionnement et dans les services qu'elles offrent à leur public. Le service est décomposé en deux parties: a) une partie "professionnelle" où les bibliothécaires peuvent retrouver des informations professionnelles et des liens vers les organismes, les institutions, et les projets et réalisations ayant trait à leur activité; b) une partie comprenant annuaire, mode d'emploi de l'internet, villes et provinces, etc… permet au public des bibliothèques d'utiliser le service Biblio On Line comme un point d'entrée vers internet.»

Le site de l'ENSSIB (Ecole nationale supérieure des sciences de l'information et des bibliothèques) héberge la version électronique du Bulletin des bibliothèques de France (BBF), une revue professionnelle bimensuelle dans laquelle «professionnels et spécialistes de l'information discutent de toutes les questions concernant la politique et le développement des bibliothèques et des centres de documentation: évolution par secteur, grands projets, informatisation, technologies de l'information, écrits électroniques, réseaux, coopération, formation, gestion, patrimoine, usagers et publics, livre et lecture…» Annie Le Saux, rédactrice de la revue, relate en juillet 1998: «C'est en 1996 que le BBF a commencé à paraître sur internet (les numéros de 1995). (…) Nous nous servons beaucoup du courrier électronique pour prendre contact avec nos auteurs et pour recevoir leurs articles. Cela diminue grandement les délais. Nous avons aussi recours au web pour prendre connaissance des sites mentionnés lors de colloques, vérifier les adresses, retrouver des indications bibliographiques dans les catalogues des bibliothèques…»

Avec cette manne documentaire qu'offre désormais l'internet, que vont devenir les bibliothécaires-documentalistes? Vont-ils devenir des cyberthécaires, ou bien vont-ils progressivement disparaître parce que les usagers n'auront tout simplement plus besoin d'eux? Le métier de bibliothécaire n'en est pas à sa première transformation. L'apparition de l'informatique permet au bibliothécaire de remplacer des catalogues de fiches sur bristol par des catalogues consultables à l'écran, avec un classement alphabétique ou systématique effectué non plus par lui-même mais par la machine. L'informatisation du prêt et de la gestion des commandes fait disparaître l'impressionnant stock de fiches et bordereaux nécessaires lors des opérations manuelles. L'informatique en réseau permet ensuite la gestion de catalogues collectifs regroupant dans une même base de données les catalogues des bibliothèques de la même région, du même pays ou de la même spécialité, entraînant du même coup des services très facilités pour le prêt inter-bibliothèques et le regroupement des commandes auprès des fournisseurs. Puis les bibliothèques ouvrent un serveur minitel pour la consultation de leur catalogue, désormais disponible au domicile du lecteur. Ces catalogues sont progressivement transférés sur l'internet, avec une consultation plus souple et plus attractive que sur minitel. Outre un catalogue, les sites web des bibliothèques offrent un ensemble de documents numérisés ou encore un choix de liens hypertextes vers d'autres sites, évitant ainsi aux usagers de se perdre sur la toile.

= Quelques expériences

Il ne semble donc pas que la profession soit en danger, au contraire. Piloter les usagers sur l'internet, filtrer et organiser l'information à leur intention, créer et gérer un site web, rechercher des documents dans des bases de données spécialisées, telles sont désormais les tâches de nombreux bibliothécaires. Le bibliothécaire devient cyberthécaire, comme en témoignent diverses expériences relatées au fil des ans, par Peter Raggett en 1998, Bruno Didier en 1999, Bakayoko Bourahima et Emmanuel Barthe en 2000, et Anissa Rachef en 2001.

Peter Raggett est directeur du centre de documentation et d'information (CDI) de l'OCDE. Située à Paris, l'OCDE (Organisation de coopération et de développement économiques) regroupe trente pays membres. Au noyau d'origine, constitué des pays d'Europe de l'Ouest et d'Amérique du Nord, viennent s'ajouter le Japon, l'Australie, la Nouvelle-Zélande, la Finlande, le Mexique, la République tchèque, la Hongrie, la Pologne et la Corée. Réservé aux fonctionnaires de l'organisation, le centre de documentation permet la consultation de quelque 60.000 monographies et 2.500 périodiques imprimés. En ligne depuis 1996, les pages intranet du CDI deviennent une source d'information essentielle pour le personnel.

«Je dois filtrer l'information pour les usagers de la bibliothèque, ce qui signifie que je dois bien connaître les sites et les liens qu'ils proposent, explique Peter Raggett en juin 1998. J'ai sélectionné plusieurs centaines de sites pour en favoriser l'accès à partir de l'intranet de l'OCDE. Cette sélection fait partie du bureau de référence virtuel proposé par la bibliothèque à l'ensemble du personnel. Outre de nombreux liens, ce bureau de référence contient des pages recensant les articles, monographies et sites web correspondant aux différents projets de recherche en cours à l'OCDE, l'accès en réseau aux CD-Rom et une liste mensuelle des nouveaux titres.»

Comment voit-il l'avenir de la profession? «L'internet offre aux chercheurs un stock d'informations considérable. Le problème pour eux est de trouver ce qu'ils cherchent. Jamais auparavant on n'avait senti une telle surcharge d'informations, comme on la sent maintenant quand on tente de trouver un renseignement sur un sujet précis en utilisant les moteurs de recherche disponibles sur l'internet. A mon avis, les bibliothécaires auront un rôle important à jouer pour améliorer la recherche et l'organisation de l'information sur le réseau. Je prévois aussi une forte expansion de l'internet pour l'enseignement et la recherche. Les bibliothèques seront amenées à créer des bibliothèques numériques permettant à un étudiant de suivre un cours proposé par une institution à l'autre bout du monde. La tâche du bibliothécaire sera de filtrer les informations pour le public. Personnellement, je me vois de plus en plus devenir un bibliothécaire virtuel. Je n'aurai pas l'occasion de rencontrer les usagers, ils me contacteront plutôt par courriel, par téléphone ou par fax, j'effectuerai la recherche et je leur enverrai les résultats par voie électronique.»

En 1999, Bruno Didier est bibliothécaire à l'Institut Pasteur (Paris), une fondation privée dont le but est la prévention et le traitement des maladies infectieuses par la recherche, l'enseignement et des actions de santé publique. Séduit par les perspectives qu'offre le réseau pour la recherche documentaire, Bruno Didier crée le site web de la bibliothèque en 1996 et devient son webmestre. «Le site web de la bibliothèque a pour vocation principale de servir la communauté pasteurienne, relate-t-il en août 1999. Il est le support d'applications devenues indispensables à la fonction documentaire dans un organisme de cette taille: bases de données bibliographiques, catalogue, commande de documents et bien entendu accès à des périodiques en ligne. C'est également une vitrine pour nos différents services, en interne mais aussi dans toute la France et à l'étranger. Il tient notamment une place importante dans la coopération documentaire avec les instituts du réseau Pasteur à travers le monde. Enfin j'essaie d'en faire une passerelle adaptée à nos besoins pour la découverte et l'utilisation d'internet. (…) Je développe et maintiens les pages du serveur, ce qui s'accompagne d'une activité de veille régulière. Par ailleurs je suis responsable de la formation des usagers, ce qui se ressent dans mes pages. Le web est un excellent support pour la formation, et la plupart des réflexions actuelles sur la formation des usagers intègrent cet outil.»

Son activité professionnelle a changé de manière radicale, tout comme celle de ses collègues. «C'est à la fois dans nos rapports avec l'information et avec les usagers que les changements ont eu lieu, explique-t-il. Nous devenons de plus en plus des médiateurs, et peut-être un peu moins des conservateurs. Mon activité actuelle est typique de cette nouvelle situation: d'une part dégager des chemins d'accès rapides à l'information et mettre en place des moyens de communication efficaces, d'autre part former les utilisateurs à ces nouveaux outils. Je crois que l'avenir de notre métier passe par la coopération et l'exploitation des ressources communes. C'est un vieux projet certainement, mais finalement c'est la première fois qu'on dispose enfin des moyens de le mettre en place.»

En 2000, Bakayoko Bourahima est responsable de la bibliothèque de l'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan, un établissement qui assure la formation de statisticiens pour les pays africains d'expression française. Le site web de l'ENSEA est mis en ligne en avril 1999 dans le cadre du réseau REFER, mis sur pied par l'Agence universitaire de la Francophonie (AUF) pour desservir la communauté scientifique et technique en Europe de l'Est, en Asie et en Afrique (24 pays participants en 2002).

Bakayoko Bourahima s'occupe de la gestion de l'information scientifique et technique et de la diffusion des travaux publiés par l'Ecole. En ce qui concerne l'internet, «mon service a eu récemment des séances de travail avec l'équipe informatique pour discuter de l'implication de la bibliothèque dans l'animation du site, relate-t-il en juillet 2000. Le service de la bibliothèque travaille aussi à deux projets d'intégration du web pour améliorer ses prestations. (…) J'espère bientôt pouvoir mettre à la disposition de mes usagers un accès internet pour l'interrogation de bases de données. Par ailleurs, j'ai en projet de réaliser et de mettre sur l'intranet et sur le web un certain nombre de services documentaires (base de données thématique, informations bibliographiques, service de références bibliographiques, bulletin analytique des meilleurs travaux d'étudiants…). Il s'agit donc pour la bibliothèque, si j'obtiens les financements nécessaires pour ces projets, d'utiliser pleinement l'internet pour donner à notre école un plus grand rayonnement et de renforcer sa plateforme de communication avec tous les partenaires possibles. En intégrant cet outil au plan de développement de la bibliothèque, j'espère améliorer la qualité et élargir la gamme de l'information scientifique et technique mise à la disposition des étudiants, des enseignants et des chercheurs, tout en étendant considérablement l'offre des services de la bibliothèque.»

En 2000, Emmanuel Barthe est documentaliste juridique et responsable informatique de Coutrelis & Associés, un cabinet d'avocats parisien. «Les principaux domaines de travail du cabinet sont le droit communautaire, le droit de l'alimentation, le droit de la concurrence et le droit douanier, écrit-il en octobre 2000. Je fais de la saisie indexation, et je conçois et gère les bases de données internes. Pour des recherches documentaires difficiles, je les fais moi-même ou bien je conseille le juriste. Je suis aussi responsable informatique et télécoms du cabinet : conseils pour les achats, assistance et formation des utilisateurs. De plus, j'assure la veille, la sélection et le catalogage de sites web juridiques: titre, auteur et bref descriptif. Je suis également formateur internet juridique aussi bien à l'intérieur de mon entreprise qu'à l'extérieur lors de stages de formation.»

Emmanuel Barthe est aussi le modérateur de Juriconnexion, une liste de discussion créée par l'association du même nom. «L'association Juriconnexion a pour but la promotion de l'électronique juridique, c'est-à-dire la documentation juridique sur support électronique et la diffusion des données publiques juridiques. Elle organise des rencontres entre les utilisateurs et les éditeurs juridiques (et de bases de données), ainsi qu'une journée annuelle sur un thème. Vis-à-vis des autorités publiques, Juriconnexion a un rôle de médiateur et de lobbying à la fois. L'association, notamment, est favorable à la diffusion gratuite sur internet des données juridiques produites par le Journal officiel et les tribunaux. Les bibliothécaires-documentalistes juridiques représentent la majorité des membres de l'association, suivis par certains représentants des éditeurs et des juristes.»

En 2001, Anissa Rachef est bibliothécaire et professeur à l'Institut français de Londres. Présents dans nombre de pays, les instituts français sont des organismes officiels proposant des cours et manifestations culturelles. A Londres, 5.000 étudiants environ s'inscrivent aux cours chaque année. Inaugurée en mai 1996, la médiathèque utilise l'internet dès sa création.

«L'objectif de la médiathèque est double, explique Anissa Rachef en avril 2001. Servir un public s'intéressant à la culture et la langue françaises et "recruter" un public allophone en mettant à disposition des produits d'appel tels que vidéos documentaires, livres audio, CD-Rom. La mise en place récente d'un espace multimédia sert aussi à fidéliser les usagers. L'installation d'un service d'information rapide a pour fonction de répondre dans un temps minimum à toutes sortes de questions posées via le courrier électronique, ou par fax. Ce service exploite les nouvelles technologies pour des recherches très spécialisées. Nous élaborons également des dossiers de presse destinés aux étudiants et professeurs préparant des examens de niveau secondaire. Je m'occupe essentiellement de catalogage, d'indexation et de cotation. (…) J'utilise internet pour des besoins de base. Recherches bibliographiques, commande de livres, courrier professionnel, prêt inter-bibliothèques. C'est grâce à internet que la consultation de catalogues collectifs, tels SUDOC (Système universitaire de documentation) et OCLC (Online Computer Library Center), a été possible. C'est ainsi que j'ai pu mettre en place un service de fourniture de documents extérieurs à la médiathèque. Des ouvrages peuvent désormais être acheminés vers la médiathèque pour des usagers ou bien à destination des bibliothèques anglaises.»

7.4. Dans la lignée de Handicapzéro

L'existence de bibliothèques numériques représente un tournant important pour l'accès des personnes handicapées au livre, par exemple les personnes ayant un problème visuel, à savoir 10% de la population, ou encore les personnes à motricité réduite, par exemple celles qui ne peuvent tenir un livre dans les mains ou bien tourner les pages. Pour la première fois, elles peuvent accéder à de nombreux titres du patrimoine scientifique et littéraire, et non plus seulement à un pourcentage infime, et elles peuvent accéder aux nouveautés sans devoir attendre des mois sinon des années.

= Premiers pas

Un département de la Library of Congress, le NLS (National Library Service for the Blind and Physically Handicapped), lance en août 1999 un serveur permettant aux personnes handicapées visuelles de télécharger des livres, soit au format BRF (braille format) pour une lecture sur plage braille ou une impression sur imprimante braille, soit au format DAISY (digital accessible information system) pour une écoute sur synthèse vocale. A l'ouverture du service, 3.000 livres sont disponibles pour téléchargement ou consultables en ligne. Ce service fournit aussi un synthétiseur de parole, qui est un logiciel permettant de désagréger le texte pour lecture sur synthèse vocale. Les collections du NLS comptent 4.700 titres en septembre 2003.

De son côté, l'association Recording For the Blind & Dyslexic (RFB&D) enregistre 4.000 titres par an avec l'aide de 5.000 volontaires officiant dans 32 studios d'enregistrement répartis dans tout le pays. Elle est la plus grande association de ce type aux Etats-Unis. En 2002, la RFB&D débute la numérisation de ses collections au format DAISY. 6.000 livres audionumériques sont disponibles sur CD-Rom en septembre 2002, et 37.500 livres cinq ans plus tard, en septembre 2007.

Les transcriptions en braille peuvent être rapides quand existent à la fois la motivation et les moyens. Le quatrième volet de la série best-seller de Joanne K. Rowling, Harry Potter and the Goblet of Fire, est publié par la National Braille Press (NBP) en juillet 2000, vingt jours seulement après sa sortie en librairie, avec un premier tirage de 500 exemplaires. Si les 734 pages du livre «standard» publié par Scholastic donnent 1.184 pages en braille, le prix du livre braille n'est pas plus élevé, souligne la NBP. Ce court délai est dû à deux facteurs. D'une part, Scholastic fournit le fichier électronique, une initiative dont d'autres éditeurs feraient bien de s'inspirer. D'autre part, les 31 membres de l'équipe de la NBP travaillent sans relâche pendant quinze jours. Comme pour les autres titres de la NBP, le livre est également disponible au format PortaBook, à savoir un fichier en braille informatique abrégé stocké sur disquette, pour lecture sur un lecteur braille portable ou au moyen d'un logiciel braille. Sept ans plus tard, en juillet 2007, le septième et dernier opus de la série, Harry Potter and the Deathly Hallows, est disponible chez Bookshare.org 4 heures et 20 minutes après la parution officielle le 21 juillet à minuit et une minute, le temps de scanner le livre et de mettre en forme les fichiers numériques.

Dans de nombreux pays, malgré l'existence d'un matériel informatique adapté, l'édition braille reste encore confidentielle sinon clandestine, le problème des droits d'auteur sur les transcriptions n'étant pas résolu. Les livres en gros caractères et sur cassettes sont eux aussi peu nombreux par rapport aux milliers de titres paraissant chaque année, malgré les efforts dispensés par les éditeurs spécialisés et les organismes bénévoles.

Directeur de la communication de l'association Handicapzéro, Patrice Cailleaud explique en janvier 2001 que, si le livre numérique est «une nouvelle solution complémentaire aux problèmes des personnes aveugles et malvoyantes, (…) les droits et autorisations d'auteurs demeurent des freins pour l'adaptation en braille ou caractères agrandis d'ouvrage. Les démarches sont saupoudrées, longues et n'aboutissent que trop rarement.» D'où la nécessité impérieuse de lois nationales et d'une loi internationale du droit d'auteur pour les personnes atteintes de déficience visuelle.

Richard Chotin, professeur à l'Ecole supérieure des affaires (ESA) de Lille, relate en mai 2001: «Ma fille vient d'obtenir la deuxième place à l'agrégation de lettres modernes. Un de ses amis a obtenu la maîtrise de conférence en droit et un autre a soutenu sa thèse de doctorat en droit également. Outre l'aspect performance, cela prouve au moins que, si les aveugles étaient réellement aidés (tous les aveugles n'ont évidemment pas la chance d'avoir un père qui peut passer du temps et consacrer de l'argent) par des méthodes plus actives dans la lecture des documents (obligation d'obtenir en braille ce qui existe en "voyant" notamment), le handicap pourrait presque disparaître.»

Entérinée à la même date, la directive 2001/29/CE de la Commission européenne sur «l'harmonisation de certains aspects du droit d'auteur et des droits voisins dans la société de l'information» - plus simplement appelée directive EUCD (European Union Copyright Directive) - insiste dans son article 43 sur la nécessité pour les Etats membres d'adopter «toutes les mesures qui conviennent pour favoriser l'accès aux oeuvres pour les personnes souffrant d'un handicap qui les empêche d'utiliser les oeuvres elles-mêmes, en tenant plus particulièrement compte des formats accessibles». C'est chose faite les années suivantes. En France par exemple, la loi du 1er août 2006 sur le droit d'auteur et droits voisins dans la société de l'information - plus simplement appelée loi DADVSI - prévoit l'exception au droit d'auteur en faveur des personnes handicapées, exception qui permet d'adapter à moindre coût des oeuvres originales en fonction de certains handicaps pour offrir des version numériques, des versions audio, etc.

En partenariat avec plusieurs organismes (associations, établissements d'enseignement spécialisé, éditeurs), l'association BrailleNet - fondée en 1997 par Dominique Burger - crée en novembre 2001 le serveur Hélène pour l'édition adaptée, afin de proposer en accès restreint des livres numériques permettant des impressions en braille ou en gros caractères. Ces livres sont des oeuvres littéraires récentes, des documentations techniques, des ouvrages scientifiques, des manuels scolaires et des supports de cours adaptés, ainsi que des livres du domaine public. Développé en partenariat avec l'INRIA Rhône-Alpes (INRIA: Institut national de recherche en informatique et en automatique) et soutenu par la Direction du livre et de la lecture (Ministère de la culture et de la communication), le serveur comprend 2.700 titres en août 2007, dont 70% de livres sous droits. Les fichiers numériques sont utilisés par 67 centres de transcription spécialisés situés en France et dans la Francophonie.

En parallèle, la Bibliothèque Hélène ouvre en janvier 2006 à l'intention des lecteurs déficients visuels, avec des livres pour la jeunesse, suivis ensuite d'ouvrages de littérature générale. Les collections comptent 1 200 livres, dont la moitié du domaine public. Catherine Desbuquois, gestionnaire de la bibliothèque, explique en août 2007: «Le catalogue de la bibliothèque Hélène progresse au rythme de la bonne volonté des éditeurs, qui commencent à envisager les avantages du droit de prêt numérique, mais c'est un long travail de pédagogie.» L'inscription est gratuite sur présentation d'un certificat médical. A ce stade, la lecture est possible uniquement sur le bloc-notes braille Iris de la société Eurobraille, qui coûte entre 6.595 euros et 11.910 euros selon les modèles (prix d'août 2007), et dont le parc compte 700 unités seulement dans toute l'Europe (en 2006). De ce fait, la bibliothèque touche un public réduit, avec 123 lecteurs actifs et 217 lecteurs inscrits. «L'écart significatif entre le nombre de lecteurs inscrits et le nombre de lecteurs actifs tient au fait que beaucoup de personnes intéressées par la lecture numérique - mais non équipées d'Iris - se sont inscrites dans l'attente de la mise en place du nouveau mode de lecture sécurisé (PDF) auquel travaillent BrailleNet et la société Adobe (France).» (extrait d'un document statistique de BrailleNet) Ce nouveau mode de lecture est sécurisé au moyen d'un certificat numérique individuel déposé sur un eToken, à savoir un système d'authentification sur clé USB. Disponible à l'automne 2007, il permet d'augmenter la fréquentation de la bibliothèque puisqu'une plateforme spécifique n'est plus nécessaire.

= Bookshare.org

Lancé par Benetech en 2002, Bookshare.org est à ce jour la plus grande bibliothèque numérique mondiale destinée aux personnes ayant un problème visuel, et son modèle est envié dans de nombreux pays.

Benetech est une société de la Silicon Valley (Californie) qui se donne pour objectif de mettre les technologies au service de tous les êtres humains, et pas seulement de quelques-uns. Dès ses débuts en 2001, Benetech décide de créer une grande bibliothèque numérique à l'intention des personnes aveugles et malvoyantes résidant aux Etats-Unis. L'idée étant que, à l'heure du numérique, il est beaucoup plus rapide et économique de scanner les livres récents plutôt que de les enregister sur cassettes (version audio) ou de les transcrire en braille embossé (version imprimée). Le temps nécessaire se compte en heures ou en jours, et non plus en semaines ou en mois. Et le coût se trouve réduit de 75%.

Bookshare.org est mis en ligne en février 2002. Après avoir soumis la preuve écrite de leur handicap et s'être acquittés de la somme de 25 dollars pour l'inscription, les adhérents ont accès à la bibliothèque moyennant un abonnement annuel de 50 dollars. Scannés par une centaine de volontaires, les 7.620 titres disponibles au départ sont proposés en deux formats, BRF et DAISY.

L'initiative de Bookshare.org constitue une avancée considérable. L'objectif de l'association est assez différent de celui du NLS ou du RFB&D, dont le nombre de titres est très inférieur et dont les textes sont enregistrés par des narrateurs sous contrat (NLS) ou par des volontaires (RFB&D), avec un processus de contrôle garantissant une qualité optimale et entraînant un coût assez élevé par livre. Dans le cas de Bookshare.org, le but est de proposer une grande bibliothèque de livres scannés à moindre coût au lieu d'une petite bibliothèque de livres de grande qualité.

Il faut compter entre deux et quatre heures pour scanner le livre, le convertir en texte grâce à un logiciel OCR, puis vérifier le fichier électronique obtenu pour s'assurer qu'aucune page n'a été oubliée et que les paragraphes sont distincts les uns des autres. Un second volontaire vérifie ensuite que les informations relatives au livre (auteur, titre, date, copyright) sont correctes et corrige éventuellement le fichier numérique au regard du livre original, en fonction du temps qu'il souhaite y consacrer. Un logiciel convertit enfin le livre aux formats BRF et DAISY. L'association distingue trois niveaux de qualité pour le livre numérisé: excellent (pratiquement sans erreur), bon (avec quelques erreurs) et correct (avec beaucoup d'erreurs, mais lisible), ceci en fonction de la qualité du logiciel OCR utilisé. Le coût de production est estimé à 6 dollars US pour un roman et 50 dollars pour un manuel d'enseignement dont le contenu est entièrement vérifié au regard de l'original.

Si, jusque-là, moins de 5% des titres publiés aux Etats-Unis sont disponibles en version braille ou en version audio, la seule limite devient celle du nombre de volontaires scannant les livres. Nombreux sont ceux qui scannent déjà des livres à titre privé, pour un usage personnel ou pour un membre de leur famille aveugle ou malvoyant. L'association les incite donc à envoyer leurs fichiers et à grossir les rangs de l'équipe actuelle, afin de proposer à terme plusieurs dizaines de milliers de livres, y compris toutes les nouveautés.

Le nombre de livres et de volontaires augmente rapidement. En un an, de février 2002 à février 2003, le catalogue passe de 7.620 livres à 11.500 livres, et le nombre de volontaires de 100 à 200 personnes. Le catalogue comprend 14.000 livres en août 2003, 17.000 livres en février 2004, 20.000 livres en janvier 2005, 23.000 livres en juillet 2005 et 30.000 livres en décembre 2006. 5.000 nouveaux livres sont ajoutés au cours de l'année 2006, avec un rythme de 100 livres par semaine. En mars 2005, Bookshare.org débute des collections en espagnol, la deuxième langue du pays, avec un fonds initial de 500 livres, qui passe à 1.000 livres en décembre 2006. A la même date, la bibliothèque compte 5.000 adhérents.

Bookshare.org propose aussi des oeuvres du domaine public en téléchargement libre. Accessibles à tous, abonnés ou non, ces oeuvres sont disponibles en quatre formats: HTML, TXT, BRF et DAISY. Toujours en tête de file lorsqu'il s'agit de lecture pour tous, le Projet Gutenberg met à la disposition de l'association l'ensemble de ses collections.

En juillet 2002, Bookshare.org passe un partenariat avec le service Braille Press du Braille Institute of America pour proposer des éditions en braille embossé à toute personne résidant aux Etats-Unis, moyennant un coût modique. Les transcripteurs et correcteurs de la Braille Press produisent 13 millions de pages par an à destination des écoles, des entreprises, des agences gouvernementales et des particuliers. En février 2003, Bookshare.org s'associe avec la société Pulse Data pour que ses livres puissent être facilement téléchargés sur le BrailleNote, un assistant personnel destiné aux personnes malvoyantes. En février 2004, Bookshare.org lance diverses formules d'inscription à destination des écoles et des groupes. En avril 2004, l'association LightHouse International débute une collection de livres sur l'emploi et le développement professionnel à l'intention des membres de la bibliothèque. En 2005, Bookshare.org procure un logiciel de synthèse vocale lors de l'inscription. Il s'agit du Victor Reader de la société HumanWare (qui remplace Pulse Data en janvier 2005).

Bookshare.org n'aurait pu voir le jour sans la volonté bien ancrée de l'équipe de faire appliquer un amendement spécifique de la loi sur le copyright, le 1996 Chafee Amendment (U.S. Copyright Law, 17 U.S.C. § 121). Cet amendement autorise la distribution d'oeuvres littéraires dans des formats adaptés, et ce auprès des personnes handicapées visuelles, des personnes souffrant d'un handicap de lecture (par exemple la dyslexie) et des personnes à motricité réduite (par exemple les personnes ne pouvant tourner les pages d'un livre). Toute version numérique doit obligatoirement inclure la mention du copyright, avec le nom de l'éditeur détenteur des droits et la date originale de publication.

De plus, dès sa phase initiale, Bookshare.org s'assure du soutien de l'Association of American Publishers (AAP), et prend en compte les diverses remarques faites par l'AAP et plusieurs éditeurs. Le fait que les livres ne puissent être utilisés que par la communauté concernée est strictement appliqué, avec un système adapté de gestion des droits numériques - fichiers encryptés, empreintes digitales, autres procédures de contrôle - et les infractions sont immédiatement sanctionnées. De plus, plusieurs éditeurs et auteurs donnent à Bookshare.org le droit de mettre leurs livres à la disposition de ses adhérents. C'est le cas par exemple de O'Reilly Media, éditeur de manuels informatiques et de livres sur les technologies qui, en mars 2003, passe un accord avec Bookshare.org pour que ses livres soient intégrés aux collections dès publication et convertis aux formats BRF et DAISY.

En mars 2006, suite à une phase pilote menée depuis 2004, Bookshare.org s'associe officiellement avec la National Federation of the Blind (NFB) pour proposer la lecture vocale de 125 journaux et magazines régionaux et nationaux. Cette lecture était jusque-là réservée aux adhérents de la NFB, et possible uniquement par téléphone au moyen d'une synthèse vocale. Les membres de Bookshare.org peuvent désormais lire ces périodiques sur leur ordinateur. 150 titres sont disponibles en décembre 2006.

En mai 2007, Benetech lance un service international. 15% des collections - 4 600 livres en anglais et 600 livres en espagnol - sont disponibles à l'intention des personnes ayant un problème similaire dans d'autres pays.

Qu'en est-il de Benetech, la société fondatrice de Bookshare.org? Benetech est fondé en 2001 par Jim Fruchterman, pour prendre la suite d'Arkenstone, une société spécialisée dans les appareils de lecture pour personnes aveugles. Benetech conçoit, développe et met en oeuvre des technologies novatrices au service du handicap, des droits humains, de l'alphabétisation, de l'éducation et de la fracture numérique. Pour tous les projets qu'elle lance, la société privilégie un retour sur investissement plus social que financier. Après avoir lancé Bookshare.org, Benetech lance notamment Route 66, un logiciel de lecture pour l'alphabétisation des adultes, et Martus, un logiciel sécurisé permettant de recenser les atteintes aux droits de l'homme.

= Handicapzéro

Dans la Francophonie, l'association la plus active dans ce domaine est Handicapzéro, qui a pour but d'améliorer l'autonomie des personnes handicapées visuelles, à savoir 10% de la population francophone. L'association est créée en 1987 à partir du constat suivant: l'information visuelle est omniprésente, mais les personnes aveugles et malvoyantes n'y ont pas accès. En France par exemple, une personne sur mille est aveugle, une personne sur cent est malvoyante et une personne sur deux a des problèmes de vue. Selon le Programme de prévention de la cécité publié par l'Organisation mondiale de la santé (OMS) en 2001, on dénombre 1,5 million de déficients visuels, dont 112.000 personnes aveugles et 250.000 personnes dont l'acuité visuelle est en dessous de 4 dizièmes.

Mis en ligne en septembre 2000, le site web de l'association devient rapidement le site adapté le plus visité, avec 10.000 requêtes mensuelles. Suite à cette première expérience réussie, l'association lance en février 2003 un portail généraliste offrant en accès libre l'information nationale et internationale en temps réel (en partenariat avec l'Agence France-Presse), l'actualité sportive (avec le journal L'Equipe), les programmes de télévision (avec le magazine Télérama), la météo (avec Météo France) et un moteur de recherche (avec Google), ainsi que toute une gamme de services dans les domaines de la santé, de l'emploi, de la consommation, des loisirs, des sports et de la téléphonie.

Les personnes aveugles peuvent accéder au site au moyen d'une plage braille ou d'une synthèse vocale. Les personnes malvoyantes peuvent paramétrer leur propre «confort de lecture», à savoir la taille et la police des caractères ainsi que la couleur du fond d'écran pour une navigation confortable, en créant puis en modifiant leur profil selon leur potentiel visuel. Ce profil est utilisable pour la lecture de n'importe quel texte situé sur le web, en faisant un copier-coller dans la fenêtre prévue à cet effet. Les personnes voyantes peuvent correspondre en braille avec des aveugles par le biais du site, l'association assurant gratuitement la transcription et l'impression braille des courriers (4.000 caractères maximum) ainsi que leur expédition par voie postale dans les pays de l'Union européenne. Handicapzéro entend ainsi démontrer «que, sous réserve du respect de certaines règles élémentaires, l'internet peut devenir enfin un espace de liberté pour tous».

L'association permet aussi à l'internaute de recevoir directement à son domicile un document adapté à ses besoins, en braille, en caractères agrandis ou en audio. 80.000 documents sont édités en braille et en caractères agrandis en 2005, et 90.000 documents en 2006, avec un champ d'action dans 15 pays. Par le biais du site ou à partir du numéro vert de l'association, 20.000 personnes en 2005 et 25.000 personnes en 2006 bénéficient gratuitement des services de plus de 200 collectivités et entreprises partenaires. Le site reçoit la visite de 200.000 visiteurs par mois. En octobre 2006, le portail adopte une nouvelle présentation en enrichissant encore son contenu, en adoptant une navigation plus intuitive pour la page d'accueil, en proposant des raccourcis de clavier, en offrant un service amélioré pour l'affichage «confort de lecture», etc. Plus de 2 millions de visiteurs utilisent les services du portail au cours de l'année 2006.

= Bibliothèque numérique pour le Handicap

Handicapzéro est l'un des nombreux partenaires de la Bibliothèque numérique pour le Handicap (BnH), un projet novateur qui voit le jour en janvier 2006 à l'initiative de la ville de Boulogne-Billancourt (région parisienne) et sous l'égide d'Alain Patez, bibliothécaire numérique chargé de mission pour la BnH. Celui-ci explique: «Projet à vocation nationale, la BnH repose sur la conviction que l'édition numérique est le moyen d'accès à l'information et à la culture le mieux adapté aux personnes en situation de handicap. L'objectif de la BnH est de permettre à toute personne confrontée à un handicap de télécharger à distance des livres numériques. Ces documents sont commercialisés dans le public, donc non libres de droit de reproduction.»

La BnH se veut un service public proposant un accès adapté à l'édition, et non un accès à l'édition adaptée. Elle propose un service de prêt de livres numériques et de livres audio téléchargeables et chronodégradables (durée limitée dans le temps). En 2006, lors de sa première année de fonctionnement à titre expérimental en tant que projet d'étude et de recherche, la bibliothèque compte 400 lecteurs, 971 titres (60% fiction et 40% documentaires) et 1.500 prêts. Chaque livre est disponible en cinq exemplaires numériques (permettant cinq accès simultanés) et dix exemplaires audio (permettant dix accès simultanés). Le prêt est de trois livres pour une durée de trois semaines. Les personnes inscrites sont pour moitié des handicapés moteurs et pour moitié des handicapés visuels.

Comment la BnH voit-elle le jour? Alain Patez est responsable des éditions numériques à la Médiathèque Landowski de Boulogne-Billancourt depuis juin 2000. L'ouverture de la BnH est précédée de deux expériences. Première expérience, un service de prêt de tablettes de lecture Cybook qui débute en février 2002 au sein de la Médiathèque Landowski. Le public intéressé s'avère être de grands lecteurs, plutôt âgés, et des lecteurs malvoyants. Mais la société Cytale, qui développe et commercialise le Cybook, cesse ses activités quelques mois plus tard. Deuxième expérience, suite à un partenariat avec la société Mobipocket, spécialisée dans la lecture et la distribution sécurisée de livres numériques, la Bibliothèque numérique Landowski (BnL) crée en février 2003 un service de prêt de livres d'une durée de deux semaines. Cette bibliothèque comprend 1 100 titres, essentiellement des oeuvres de fiction (65% de livres en français, 30% en anglais, 5% en allemand et en espagnol). La BnL totalise 256 lecteurs et 1 020 emprunts pour l'année 2005.

En 2003, la BnL passe un partenariat avec l'Association du locked-in syndrome (ALIS), - qui regroupe des personnes tétraplégiques et muettes communiquant uniquement par clignement de paupières - pour que les malades de l'association puissent avoir accès à la bibliothèque numérique. De ce partenariat émerge l'idée d'une bibliothèque à vocation nationale pour les personnes handicapées.

Début 2005, un groupe est constitué avec des représentants de la ville de Boulogne-Billancourt, l'Association du locked-in syndrome (ALIS), l'Association française contre les myopathies (AFM), l'Association des paralysés de France (APF) et la Mission handicap de l'Assistance publique - Hôpitaux de Paris (AP-HP). Ce groupe décide en mai 2005 de développer une bibliothèque numérique pour le handicap. Après approbation à l'unanimité par le conseil municipal de Boulogne-Billancourt en septembre 2005, la BnH est lancée en janvier 2006. Son comité technique de pilotage est composé des associations ci-dessus, auxquelles s'ajoutent l'Association Valentin Haüy (AVH), le Groupement pour l'insertion des personnes handicapées physiques (GIHP) et l'Union nationale des associations de parents et amis de personnes handicapées mentales (UNAPEI).

Qu'est-ce exactement qu'une bibliothèque numérique du handicap? Alain Patez explique en juin 2007: «Il faut lever une ambiguïté : le livre numérique n'est pas à proprement parler de l'édition adaptée - braille, gros caractères… - mais fournit un accès adapté à l'édition: il nécessite en effet une médiation technique. C'est en particulier une orthèse de lecture pour certains types de handicap : l'accès au texte imprimé est limité pour la manipulation dans le cas de handicaps moteurs très lourds, tels les locked-in syndrome; ces difficultés sont supprimées avec la fonction de défilement automatique du texte.»

Le financement des livres est pris en charge par la ville de Boulogne-Billancourt et l'Association française contre les myopathies (AFM). L'AFM finance également l'étude sur la lecture numérique (ELUPHA - Etude de la lecture numérique pour les personnes handicapées) et le site de la bibliothèque au regard des différents critères d'accessibilité. La plateforme technique est entièrement gérée par la société Numilog, spécialisée dans la distribution de livres numériques.

Denis Zwirn, président de Numilog, explique en juin 2007: «Numilog, en tant que principal diffuseur français de livres numériques, fournit à la Bibliothèque numérique pour le Handicap sa plateforme technique - permettant de gérer le prêt des livres depuis un site dédié et adapté aux personnes non voyantes - et le catalogue des livres prêtés. Ces livres et audiolivres sont issus des accords passés par Numilog avec de nombreux éditeurs francophones, parmi lesquels entre autres : Gallimard, POL, Le Dilettante, Le Rocher, La Découverte, De Vive Voix, Eyrolles ou Pearson Education France. Ce projet est particulièrement important pour Numilog, tant par les services qu'il rend à des personnes atteintes de diverses formes de handicap, que par le fait qu'il démontre la valeur ajoutée apportée par le numérique à la lecture et au développement de ses accès. Il montre également la possibilité de proposer des modèles techniques et économiques adaptés aux personnes handicapées et satisfaisant les éditeurs, dont les droits sont parfaitement respectés au sein de cette bibliothèque numérique.»

La bibliothèque comprend 1.098 livres en juin 2007. Ces livres sont disponibles en plusieurs formats. Le format PRC permet la lecture sur assistant personnel (PDA) et sur smartphone. Le format PDF peut être lu avec JAWS, un logiciel de lecture d'écran sur plateforme Windows utilisé par 80% des personnes aveugles. Ces deux formats permettent notamment le défilement automatique du texte - le lecteur n'est donc plus dépendant d'un tiers pour tourner les pages - et le grossissement de la taille des caractères. Les livres audio sont au format WMA (Windows media audio), lisible sur les logiciels Windows Media et Real Player, tout comme sur baladeur WMA. Tous ces livres audio sont lus par des comédiens et parfois par les auteurs eux-mêmes, et sont disponibles par ailleurs en librairie sous forme de CD-Rom.

En septembre 2007, l'accès à la BnH est généralisé à toutes les personnes en situation de handicap - aveugles et malvoyants, sourds et malentendants, handicapés moteurs, handicapés psychiques et mentaux. Dans cette optique, Alain Patez précise en juin 2007: «Je travaille au rapprochement de la BnH avec des institutions ou des organisations nationales et internationales liées à la question du handicap, de tous les handicaps. La BnH est d'abord et avant tout un projet collaboratif, partenarial, et pourrait devenir un projet "sans frontière". C'est notamment le cas avec la Bibliothèque nationale de France. Concrètement, et dans un premier temps, les lecteurs handicapés pourront télécharger des ouvrages de la BnH à partir des postes informatiques qui leur sont dédiés.»

Il ajoute en août 2007: «La BnH s'adresse aux lecteurs quel que soit leur handicap, leur lieu géographique ou leur support de lecture; le handicap peut d'ailleurs être définitif ou temporaire, comme dans le cas d'une hospitalisation. Un don important de Hewlett-Packard France va permettre à un partenaire de la BnH, l'hôpital Raymond Poincaré de Garches (région parisienne), de créer le premier service de prêt de portables dans un hôpital public français. De quoi favoriser le développement de la lecture numérique en milieu hospitalier.»

7.5. Une future bibliothèque planétaire

En 2005, alors que le Projet Gutenberg poursuit tranquillement la mise en ligne gratuite des oeuvres du domaine public, une tâche immense entreprise depuis nombre d'années, le livre devient un objet convoité par les géants de l'internet que sont Google, Yahoo! et Microsoft, d'une part par souci méritoire de mettre le patrimoine mondial à la disposition de tous, d'autre part à cause de l'enjeu représenté par les recettes publicitaires générées par les liens commerciaux accolés aux résultats des recherches. L'Internet Archive considère quant à elle qu'un projet de cette ampleur ne doit pas être lié à des enjeux commerciaux et fonde à cet effet l'Open Content Alliance (OCA) pour fédérer un grand nombre de partenaires dans l'optique d'une bibliothèque planétaire publique.

= Google Book Search / Google Livres

Le moteur de recherche Google décide de mettre son expertise au service du livre. En octobre 2004, il lance la première partie de son programme Google Print, établi en partenariat avec les éditeurs pour pouvoir consulter à l'écran des extraits de livres, puis commander les livres auprès d'une librairie en ligne. La version bêta de Google Print est mise en ligne en mai 2005. En novembre 2004, Google lance Google Scholar, qui indexe la production scientifique et universitaire disponible sur le web. En décembre 2004, Google lance la deuxième partie de son programme Google Print, cette fois à destination des bibliothèques. Il s'agit d'un projet de bibliothèque numérique de 15 millions de livres consistant à numériser plusieurs grandes bibliothèques partenaires, à commencer par la bibliothèque de l'Université du Michigan (dans sa totalité, à savoir 7 millions d'ouvrages), les bibliothèques des Universités de Harvard, de Stanford et d'Oxford, et celle de la ville de New York. Le coût estimé au départ se situe entre 150 et 200 millions de dollars US, avec la numérisation de 10 millions de livres sur six ans, et une durée totale de dix ans. En août 2005, Google Print est suspendu pour un temps indéterminé pour cause de conflit avec les éditeurs de livres sous droits.

Le programme reprend en août 2006 sous le nouveau nom de Google Book Search, dénommé Google Livres pour la version française. Google Book Search permet des recherches par date, titre ou éditeur. La numérisation des fonds de grandes bibliothèques se poursuit, axée cette fois sur les livres libres de droit, tout comme le développement de partenariats avec les éditeurs qui le souhaitent. Les livres libres de droit sont consultables à l'écran en texte intégral, leur contenu est copiable et l'impression est possible page à page. Ils sont également téléchargeables sous forme de fichiers PDF et imprimables dans leur entier. Les liens publicitaires associés aux pages de livres sont situés en haut et à droite de l'écran. Le conflit avec les éditeurs se poursuit lui aussi, puisque Google continue de numériser des livres sous droits sans l'autorisation préalable des éditeurs en invoquant le droit de citation pour présenter des extraits sur le web. L'Authors Guild et l'Association of American Publishers (AAP) invoquent pour leur part le non respect de la législation relative au copyright pour attaquer Google en justice. Le feuilleton judiciaire promet de durer.

Alexandre Laumonier, directeur des éditions Kargo, participe au programme Google Livres en France. Dans La non affaire Google Livres, suite, un texte daté de juin 2006 et publié sur le site de l'éditeur, il propose une analyse lucide des véritables enjeux: «Sur le fond, au-delà des discours et des rebonds, au-delà des problèmes juridiques à régler, au-delà des intérêts économiques et/ou corporatistes que chacun(e) essaie de défendre, au-delà des technologies encore balbutiantes, au-delà d'un antiaméricanisme primaire qui se révèle ici et là, au fond les véritables interrogations que posent les transformations technologiques, notamment lorsqu'elles impliquent certaines formes de savoir, sont celles du partage de l'information, du savoir en tant que bien commun, des qualités et des défauts de l'écriture numérique, qui permet désormais une maniabilité du savoir comme jamais cela n'avait été possible auparavant. Rarement trouve-t-on, dans les quelques discussions ici et là sur Google Livres, les mots "bien commun", "partage du savoir", "démocratisation de l'écriture"… Car c'est bien de cela dont il s'agit, au moment où l'on constate que l'objet-livre, qui symboliquement et dans les faits, était jusqu'à maintenant le seul garant d'une vérité, ne l'est plus (seulement).»

Michel Valensi, directeur des éditions de l'Eclat, passe lui aussi un partenariat avec Google Livres en août 2005. Dans Faut-il une grande cuiller pour signer avec Google? (version 2.0), un texte en ligne daté de septembre 2006 et disponible sur le site de l'éditeur, il explique: «Le projet Google Livres est le premier projet de grande envergure (il en existait d'autres auparavant, parmi lesquels le lyber lui-même; il en existera d'autres dans les mois à venir) qui permet une entrée en force du Livre dans l'internet. Après la multiplication des sites de toutes sortes sur les sujets les plus divers et la prolifération épidémique des blogs (dont le terme même, onomatopéïque, dit toute la profondeur: blog!) on en revient au Livre comme source première d'information. On permet l'accès à une partie des contenus, on permet une recherche thématique à l'intérieur du livre, on renvoie à d'autres livres, à l'éditeur, vers des librairies, etc., mais jamais on ne se substitue au livre, dont la forme reste omni-présente à travers l'image même des pages consultées. Contrairement aux sites, on ne peut ni télécharger, ni imprimer. Paradoxalement, Google Livres indique ainsi les limites d'une information infinie (qui est un leurre) surfant de blogs en sites, et propose un retour (qui est une avancée) vers un médium ancien, encore aujourd'hui sans équivalent.»

Fin 2006, Google scanne 3.000 livres par jour, ce qui représenterait un million de livres par an. Le coût estimé serait de 30 dollars par livre - d'autres sources mentionnent un coût double - et les collections actuelles se monteraient à 3 millions de livres. Tous chiffres à prendre avec précaution, la société ne communiquant pas de statistiques à ce sujet. A l'exception de la New York Public Library, les collections en cours de numérisation appartiennent toutes à des bibliothèques universitaires (Harvard, Stanford, Michigan, Oxford, Californie, Virginie, Wisconsin-Madison, Complutense de Madrid). S'y ajoutent début 2007 les bibliothèques des Universités de Princeton et du Texas (Austin), ainsi que la Biblioteca de Catalunya (Catalogne, Espagne) et la Bayerische Staatbibliothek (Bavière, Allemagne). En mai 2007, Google annonce la participation de la première bibliothèque francophone, la Bibliothèque cantonale et universitaire (BCU) de Lausanne (Suisse), pour la numérisation de 100.000 titres en français, allemand et italien publiés entre le 17e et le 19e siècle, qui seront consultables dans leur intégralité et téléchargeables au format PDF.

= Open Content Alliance

Parallèlement est lancée une autre initiative du même genre, mais cette fois respectueuse du copyright et sur un modèle ouvert. En janvier 2005, l'Internet Archive s'associe à Yahoo! pour mettre sur pied l'Open Content Alliance (OCA), une initiative visant à créer un répertoire libre et multilingue de livres numérisés et de documents multimédias pour consultation sur n'importe quel moteur de recherche. L'OCA est officiellement lancée en octobre 2005. Un site de démonstration, l'Open Library, présente quelques livres numérisés issus des fonds de l'Université de Californie. Le but de l'initiative est de s'inspirer de Google Livres tout en évitant ses travers, à savoir la numérisation des livres sous droits sans l'accord préalable des éditeurs, tout comme la consultation et le téléchargement impossibles sur un autre moteur de recherche.

L'OCA regroupe de nombreux partenaires: des bibliothèques et des universités bien sûr, mais aussi des organisations gouvernementales, des associations à but non lucratif, des organismes culturels et des sociétés informatiques (Adobe, Hewlett Packard, Microsoft, etc.). Les premiers partenaires sont les bibliothèques des Universités de Californie et de Toronto, l'European Archive, les Archives nationales du Royaume-Uni, O'Reilly Media et Prelinger Archives. Seuls les livres appartenant au domaine public sont numérisés, pour éviter les problèmes de copyright auxquels se heurte Google. Les collections numérisées alimenteront la section Text Archive de l'Internet Archive.

Qu'est-ce exactement que l'Internet Archive, l'organisme pilotant l'Open Content Alliance? Fondée en avril 1996 par Brewster Kahle à San Francisco, l'Internet Archive a pour but premier de constituer, stocker, préserver et gérer une «bibliothèque» de l'internet, en archivant la totalité du web tous les deux mois, afin d'offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l'internet pour les générations futures. En octobre 2001, l'Internet Archive met ses archives en accès libre sur le web grâce à la Wayback Machine, qui permet à tout un chacun de consulter l'historique d'un site web, à savoir le contenu et la présentation d'un site web à différentes dates, théoriquement tous les deux mois, à partir de 1996. L'Internet Archive débute aussi la constitution de collections numériques telles que le Million Book Project (10.520 livres en avril 2005), des archives de films de la période 1903-1973, des archives de concerts live récents, des archives de logiciels, etc. Toutes ces collections sont en consultation libre sur le web.

En décembre 2006, l'Open Content Alliance franchit la barre des 100.000 livres numérisés, avec un rythme de 12.000 nouveaux livres par mois. A la même date, l'Internet Archive reçoit une subvention de 1 million de dollars de la part de la Sloan Foundation pour numériser les collections du Metropolitan Museum of Art (l'ensemble des livres et plusieurs milliers d'images) ainsi que certaines collections de la Boston Public Library (les 3.800 livres de la bibliothèque personnelle de John Adams, deuxième président des Etats-Unis), du Getty Research Institute, de la John Hopkins University (une série de documents liés au mouvement anti-esclavagiste) et de l'Université de Californie à Berkeley (une série de documents relatifs à la ruée vers l'or). En mai 2007, l'Open Content Alliance franchit la barre des 200.000 livres numérisés.

= Autres initiatives

Si Microsoft est l'un des partenaires de l'Open Content Alliance, il se lance également dans l'aventure à titre personnel. En décembre 2006 est mise en ligne aux Etats-Unis la version bêta de Live Search Books, qui permet une recherche par mots-clés dans les livres du domaine public. Ces livres sont numérisés par Microsoft suite à des accords passés avec de grandes bibliothèques, les premières étant la British Library et les bibliothèques des Universités de Californie et de Toronto, suivies en janvier 2007 par celles de la New York Public Library et de l'Université Cornell. Microsoft compte aussi ajouter des livres sous droits, mais uniquement avec l'accord préalable des éditeurs. Tout comme Google Book Search, Live Search Books permet de consulter les livres avec les mots-clés surlignés. Par la suite, il sera possible de télécharger les livres dans leur entier au format PDF. A ce stade, la base est beaucoup moins riche que celle de Google Book Search et son moteur de recherche plus rudimentaire. En mai 2007, Microsoft annonce des accords avec plusieurs grands éditeurs américains, dont Cambridge University Press et McGraw Hill.

En Europe, certains s'inquiètent d'une soi-disant hégémonie américaine. En septembre 2005, la Commission européenne lance une vaste consultation sur un projet de bibliothèque numérique européenne, avec réponse requise en janvier 2006. Le projet est officiellement lancé en mars 2006. «Le plan de la Commission européenne visant à promouvoir l'accès numérique au patrimoine de l'Europe prend forme rapidement, lit-on dans le communiqué de presse. Dans les cinq prochaines années, au moins six millions de livres, documents et autres oeuvres culturelles seront mis à la disposition de toute personne disposant d'une connexion à l'internet, par l'intermédiaire de la "bibliothèque numérique européenne". Afin de stimuler les initiatives de numérisation européennes, la Commission va cofinancer la création d'un réseau paneuropéen de centres de numérisation. La Commission abordera également, dans une série de documents stratégiques, la question du cadre approprié à adopter pour assurer la protection des droits de propriété intellectuelle dans le cadre des bibliothèques numériques.» Cette bibliothèque numérique européenne devrait être accessible à partir de la Bibliothèque européenne, un portail commun aux 43 bibliothèques nationales d'Europe lancé en janvier 2004 par la CENL (Conference of European National Librarians) et hébergé par la Bibliothèque nationale des Pays-Bas.

7.6. Chronologie

* Cette chronologie ne prétend pas à l'exhaustivité.

1971 (juillet): Le Projet Gutenberg, fondé par Michael Hart.

1993: L'Online Books Page, créée par John Mark Ockerbloom.

1993 (avril): L'ABU, créée par l'Association des bibliophiles universels (ABU).

1994: Athena, bibliothèque numérique créée par Pierre Perroud.

1995 (mars): Internet Public Library (IPL), première bibliothèque de l'internet sur l'internet.

1995 (septembre): Gabriel, serveur des bibliothèques nationales européennes.

1996 (avril): L'Internet Archive, fondée par Brewster Kahle.

1996 (juin): La Bibliothèque électronique de Lisieux, créée par Olivier Bogros.

1996: Mise en ligne du Bulletin des bibliothèques de France (BBF).

1997: Gallica, bibliothèque numérique de la Bibliothèque nationale de France.

1997 (juillet): Cyberespace de la Bibliothèque des Nations Unies à Genève.

1998: Mise en ligne des enluminures de la Bibliothèque municipale de Lyon.

1999 (août): Serveur de la Library of Congress pour aveugles et malvoyants.

2000 (septembre): Premier site web de Handicapzéro.

2001 (octobre): Wayback Machine, sur le site de l'Internet Archive.

2002 (février): Bookshare.org, pour les personnes déficientes visuelles.

2003 (février): Portail généraliste de Handicapzéro.

2004 (janvier): Bibliothèque européenne, portail des bibliothèques nationales européennes.

2004 (octobre): Google Print, première partie, à l'intention des éditeurs.

2004 (novembre): Google Scholar.

2004 (décembre): Google Print, deuxième partie, à l'intention des bibliothèques.

2005 (août): Arrêt de Google Print.

2005 (octobre): Open Content Alliance, lancée par l'Internet Archive.

2005 (novembre): Bibliothèque numérique pour le Handicap (BnH).

2006 (mars): Projet de Bibliothèque numérique européenne.

2006 (août): Google Book Search (Google Livres).

2006 (décembre): Live Search Books, bibliothèque numérique de Microsoft.

8. UNE VASTE ENCYCLOPEDIE

[8.1. Outils de référence / Dictionnaires et encyclopédies / Dictionnaires de langues / Annuaires et portails // 8.2. Bases textuelles / Quelques exemples / Payant versus gratuit // 8.3. Catalogues collectifs / Premiers pas / WorldCat et RedLightGreen // 8.4. Chronologie]

Au fil des ans, le web devient une vaste encyclopédie. On y trouve des dictionnaires et des encyclopédies de renom, d'abord issus d'ouvrages imprimés puis nés directement sur le web, ainsi que des dictionnaires de langues, des annuaires, des portails, des bases textuelles, des catalogues collectifs, etc. Si certains organismes facturent l'utilisation de leurs services, d'autres tiennent à ce que les leurs soient en accès libre, pour favoriser la diffusion libre du savoir. Des services payants passent en gratuit, à commencer par le grand catalogue collectif mondial WorldCat.

8.1. Outils de référence

= Dictionnaires et encyclopédies

Un des premiers dictionnaires en accès libre est le Dictionnaire universel francophone en ligne, qui répertorie 45.000 mots et 116.000 définitions tout en présentant «sur un pied d'égalité, le français dit "standard" et les mots et expressions en français tel qu'on le parle sur les cinq continents». Issu de la collaboration entre Hachette et l'AUPELF-UREF (devenu depuis l'AUF - Agence universitaire de la Francophonie), il correspond à la partie «noms communs» du dictionnaire imprimé disponible chez Hachette. L'équivalent pour la langue anglaise est le site Merriam-Webster OnLine, qui donne librement accès au Collegiate Dictionary et au Collegiate Thesaurus.

En décembre 1999 apparaissent sur le web plusieurs encyclopédies de renom, parallèlement à leur version imprimée ou CD-Rom. La première encyclopédie francophone en accès libre est WebEncyclo, publiée par les éditions Atlas. La recherche est possible par mots-clés, thèmes, médias (cartes, liens internet, photos, illustrations) et idées. Un appel à contribution incite les spécialistes d'un sujet donné à envoyer des articles, qui sont regroupés dans la section «WebEncyclo contributif». Après avoir été libre, l'accès est ensuite soumis à une inscription préalable gratuite.

Mis en ligne à la même date, Britannica.com propose en accès libre l'équivalent numérique des 32 volumes de la 15e édition de l'Encyclopaedia Britannica, parallèlement à la version imprimée et à la version sur CD-Rom, toutes deux payantes. Le site web offre une sélection d'articles issus de 70 magazines, un guide des meilleurs sites, un choix de livres, etc., le tout étant accessible à partir d'un moteur de recherche unique. En septembre 2000, le site fait partie des cent sites les plus visités au monde. En juillet 2001, la consultation devient payante sur la base d'un abonnement mensuel ou annuel.

Décembre 1999 est aussi la date de mise en ligne de l'Encyclopaedia Universalis, avec 28.000 articles signés par 4.000 auteurs. Si la consultation est payante sur la base d'un abonnement annuel, de nombreux articles sont en accès libre.

La mise en ligne d'encyclopédies de renom se poursuit en 2000 et 2001.

En mars 2000, les 20 volumes de l'Oxford English Dictionary sont mis en ligne par l'Oxford University Press (OUP). La consultation du site est payante. Le dictionnaire bénéficie d'une mise à jour trimestrielle d'environ 1.000 entrées nouvelles ou révisées. Deux ans après cette première expérience, en mars 2002, l'OUP met en ligne l'Oxford Reference Online, une vaste encyclopédie conçue directement pour le web et consultable elle aussi sur abonnement payant. Avec 60.000 pages et un million d'entrées, elle représente l'équivalent d'une centaine d'ouvrages de référence.

A la même date, le Quid, encyclopédie en un volume actualisée une fois par an depuis 1963, décide de mettre une partie de son contenu en accès libre sur le web. En septembre 2000, après avoir été payante, la consultation de l'encyclopédie Encarta de Microsoft devient libre.

Issu du terme hawaïen «wiki» (qui signifie : vite, rapide), un wiki est un site web permettant à plusieurs utilisateurs de collaborer en ligne sur un même projet. A tout moment, ces utilisateurs peuvent contribuer à la rédaction du contenu, modifier ce contenu et l'enrichir en permanence. Le wiki est utilisé par exemple pour créer et gérer des dictionnaires, des encyclopédies ou encore des sites d'information sur un sujet donné. Le programme présent derrière l'interface d'un wiki est plus ou moins élaboré. Un programme simple gère du texte et des hyperliens. Un programme élaboré permet d'inclure des images, des graphiques, des tableaux, etc. L'encyclopédie wiki la plus connue est Wikipedia.

Créée en janvier 2001 à l'initiative de Jimmy Wales et de Larry Sanger, Wikipedia est une encyclopédie gratuite écrite collectivement et dont le contenu est librement réutilisable. Elle est immédiatement très populaire. Sans publicité et financée par des dons, cette encyclopédie coopérative est rédigée par des milliers de volontaires (appelés Wikipédiens), avec possibilité de corriger et de compléter les articles. Les articles restent la propriété de leurs auteurs, et leur libre utilisation est régie par la licence GFDL (GNU free documentation license). En décembre 2004, Wikipedia compte 1,3 million d'articles rédigés par 13.000 contributeurs dans 100 langues. En décembre 2006, elle compte 6 millions d'articles dans 250 langues, et elle est l'un de dix sites les plus visités du web. En avril 2007, un CD payant est édité pour la première fois avec une sélection de 2.000 articles de la version anglophone. En mai 2007, la version francophone fête ses 500.000 articles (et un CD en 2008). A la même date, Wikipedia compte 7 millions d'articles dans 192 langues, dont 1,8 million en anglais, 589.000 en allemand, 260.000 en portugais et 236.000 en espagnol.

Fondée en juin 2003, la Wikimedia Foundation gère non seulement Wikipedia mais aussi Wiktionary, un dictionnaire et thésaurus multilingue lancé en décembre 2002, puis Wikibooks (livres et manuels en cours de rédaction) lancé en juin 2003, auxquels s'ajoutent ensuite Wikiquote (répertoire de citations), Wikisource (textes appartenant au domaine public), Wikimedia Commons (sources multimédias), Wikispecies (répertoire d'espèces animales et végétales), Wikinews (site d'actualités) et enfin Wikiversity (matériel d'enseignement), lancé en août 2006. La fin 2007 voit le lancement d'un moteur de recherche dénommé Wiki Search, qui utilise le réseau de contributeurs de Wikipedia pour classer les sites en fonction de leur qualité.

Une nouvelle étape s'ouvre avec les débuts de Citizendium (qui se veut l'abrégé de: The Citizens' Compendium), une grande encyclopédie collaborative en ligne conçue en novembre 2006 et lancée en mars 2007 (version bêta) par Larry Sanger, co-fondateur de Wikipedia, mais qui quitte ensuite l'équipe de Wikipedia suite à des problèmes de qualité de contenu. Citizendium est basé sur le même modèle que Wikipedia (collaborative et gratuite) tout en évitant ses travers (vandalisme et manque de rigueur). Les auteurs signent les articles de leur vrai nom et les articles sont édités par des experts («editors») titulaires d'une licence universitaire et âgés d'au moins 25 ans. De plus, des «constables» sont chargés de la bonne marche du projet et du respect du règlement. Le jour de son lancement (25 mars 2007), Citizendium comprend 820 auteurs et 180 experts.

Dans Why Make Room for Experts in Web 2.0?, une communication datée d'octobre 2006, Larry Sanger voit dans Citizendium l'émergence d'un nouveau modèle de collaboration massive de dizaines de milliers d'intellectuels et scientifiques, non seulement pour les encyclopédies, mais aussi pour les manuels d'enseignement, les ouvrages de référence, le multimédia et les applications en 3D. Cette collaboration est basée sur le partage des connaissances, dans la lignée du web 2.0, un concept lancé en 2004 pour caractériser les notions de communauté et de partage et qui se manifeste d'abord par une floraison de wikis, de blogs et de sites sociaux. D'après Larry Sanger, il importe maintenant de créer des structures permettant des collaborations scientifiques et Citizendium pourrait servir de prototype dans ce domaine.

Un appel qui semble déjà se concrétiser avec l'Encyclopedia of Life, nouveau «compendium» dont le projet débute en mai 2007. Cette vaste encyclopédie collaborative en ligne rassemblera les connaissances sur toutes les espèces animales et végétales connues (1,8 million), y compris les espèces en voie d'extinction, avec l'ajout de nouvelles espèces au fur et à mesure de leur identification (il en existerait de 8 à 10 millions). Il s'agira d'une encyclopédie multimédia permettant de ressembler textes, photos, cartes, bandes sonores et vidéos, avec une page web par espèce, et permettant aussi d'offrir un portail unique à des millions de documents épars, en ligne et hors ligne. Outil d'apprentissage et d'enseignement pour une meilleure connaissance de notre planète, cette encyclopédie sera à destination de tous: scientifiques, enseignants, étudiants, scolaires, médias, décideurs et grand public.

Ce projet collaboratif est mené par plusieurs grandes institutions (Field Museum of Natural History, Harvard University, Marine Biological Laboratory, Missouri Botanical Garden, Smithsonian Institution, Biodiversity Heritage Library). Son directeur honoraire est Edward Wilson, professeur émérite à l'Université de Harvard, qui, dans un essai daté de 2002, est le premier à émettre le voeu d'une telle encyclopédie. Cinq ans après, en 2007, c'est chose désormais possible grâce aux avancées technologiques de ces dernières années, notamment les outils logiciels permettant l'agrégation de contenu, le mash-up (à savoir le fait de rassembler un contenu donné à partir de très nombreuses sources différentes), les wikis de grande taille et la gestion de contenu à vaste échelle. Consortium des dix plus grandes bibliothèques des sciences de la vie (d'autres suivront), la Biodiversity Heritage Library a d'ores et déjà débuté la numérisation de 2 millions de documents, dont les dates de publication s'étalent sur 200 ans. En mai 2007, date du lancement officiel du projet, on compte déjà 1,25 million de pages traitées dans les centres de numérisation de Londres, Boston et Washington DC, et disponibles sur le site de l'Internet Archive.

Le financement initial est assuré par la MacArthur Foundation (10 millions de dollars) et la Sloan Foundation (2,5 millions de dollars). 100 millions de dollars US sont nécessaires pour un financement sur dix ans, avant que l'encyclopédie ne puisse s'autofinancer. La réalisation des pages web débute courant 2007. L'encyclopédie fait ses débuts à la mi-2008. Opérationnelle d'ici trois à cinq ans, elle devrait être complète - c'est-à-dire à jour - dans dix ans.

Dans la lignée du Human Genome Project (Séquencage du génome humain), publié pour la première fois en février 2001 et appartenant d'emblée au domaine public, l'Encyclopedia of Life permettra non seulement de rassembler toutes les connaissances disponibles à ce jour sur les espèces animales et végétales, mais elle sera aussi un «macroscope» permettant de déceler les grandes tendances à partir d'un stock considérable d'informations, à la différence du microscope qui permet l'étude du détail. En plus de sa flexibilité et de sa diversité, elle permettra à chacun de contribuer au contenu sous une forme s'apparentant au wiki, ce contenu étant ensuite validé ou non par des scientifiques. La version initiale sera d'abord en anglais avant d'être traduite en plusieurs langues par de futurs organismes partenaires.

= Dictionnaires de langues

Des dictionnaires de langues sont en accès libre dès les débuts du web. Souvent sommaires et de qualité inégale, ils sont répertoriés dans Travlang, un site consacré aux voyages et aux langues créé en 1994 par Michael M. Martin.

Fondé en 1979 à Modène (Italie) par Rodrigo Vergara, Logos est une société de traduction offrant des services dans 35 langues en 1997, avec un réseau de 300 traducteurs dans le monde. Initiative peu courante à l'époque, Logos décide de mettre tous ses outils professionnels en accès libre sur le web. Dans un entretien publié dans le quotidien Le Monde du 7 décembre 1997, Rodrigo Vergara relate: «Nous voulions que nos traducteurs aient tous accès aux mêmes outils de traduction. Nous les avons donc mis à leur disposition sur internet, et tant qu'à faire nous avons ouvert le site au public. Cela nous a rendus très populaires, nous a fait beaucoup de publicité. L'opération a drainé vers nous de nombreux clients, mais aussi nous a permis d'étoffer notre réseau de traducteurs grâce aux contacts établis à la suite de cette initiative.»

Les outils de traduction disponibles sur le web comprennent un dictionnaire multilingue de 7,5 millions d'entrées (Logos Dictionary), une base de données de 553 glossaires (Linguistic Resources), des tables de conjugaison en 17 langues (Conjugation of Verbs), et enfin la Wordtheque, une base de données multilingue de 328 millions de termes issus de traductions de romans et de documents techniques. La recherche dans la Wordtheque est possible par langue, mot, auteur ou titre. En 2007, la Wordtheque, devenue la Logos Library, comprend 710 millions de termes. Conjugation of Verbs, devenu l'Universal Conjugator, propose des tableaux de conjugaison dans 36 langues. Linguistic Resources offre un point d'accès unique pour 1 215 glossaires.

Au début des années 2000, des dictionnaires bilingues et multilingues de qualité sont progressivement mis en ligne par des organismes de renom, par exemple la base Eurodicautom de la Commission européenne, ou encore Le Signet et le Grand dictionnaire terminologique (GDT) de l'Office québécois de la langue française (OQLF), tous trois en accès libre et gratuit.

Géré par le service de traduction de la Commission européenne, Eurodicautom est un dictionnaire multilingue de termes économiques, scientifiques, techniques et juridiques, avec une moyenne de 120.000 consultations quotidiennes. Il permet de combiner entre elles les onze langues officielles de l'Union européenne (allemand, anglais, danois, espagnol, finnois, français, grec, hollandais, italien, portugais, suédois), ainsi que le latin. Fin 2003, Eurodicautom annonce son intégration dans une base terminologique plus vaste regroupant les bases de plusieurs institutions de l'Union européenne. Cette nouvelle base traiterait non plus douze langues, mais une vingtaine, puisque l'Union européenne s'élargit à l'Est et passe de 15 à 25 membres en mai 2004, pour atteindre 27 membres en janvier 2007. Cette base terminologique voit le jour en mars 2007, sous le nom de IATE (Inter-Active Terminology for Europe), avec 1,4 million d'entrées dans 24 langues.

Géré par l'Office québécois de la langue française (OQLF), Le Signet propose 10.000 fiches bilingues français-anglais dans le domaine des technologies de l'information. Quant au Grand dictionnaire terminologique (GDT), il est mis en ligne en septembre 2000. Il s'agit d'un vaste dictionnaire bilingue français-anglais de 3 millions de termes du vocabulaire industriel, scientifique et commercial, qui représente l'équivalent de 3.000 ouvrages de référence imprimés. Sa mise en ligne est le résultat d'un partenariat entre l'OQLF, auteur du dictionnaire, et Semantix, société spécialisée dans les solutions logicielles linguistiques. Evénement célébré par de nombreux linguistes, cette mise en ligne est un succès. Dès le premier mois, le GDT est consulté par 1,3 million de personnes, avec des pointes de 60.000 requêtes quotidiennes. La gestion de la base est ensuite assurée par Convera Canada. En février 2003, les requêtes sont au nombre de 3,5 millions par mois. Une nouvelle version du GDT est mise en ligne en mars 2003. Sa gestion est désormais assurée par l'OQLF lui-même, et non plus par une société prestataire.

Par ailleurs, des moteurs spécifiques permettent la recherche simultanée dans plusieurs centaines de dictionnaires. Pour ne prendre qu'un exemple, le site OneLook, créé par Robert Ware, puise dans près de 9 millions de termes provenant de 936 dictionnaires généralistes et spécialisés (chiffres d'avril 2007).

Des équipes de linguistes gèrent aussi des répertoires de dictionnaires, par exemple Dictionnaires électroniques et yourDictionary.com.

Maintenu par la section française des services linguistiques centraux de la Chancellerie fédérale suisse, Dictionnaires électroniques est un excellent répertoire de dictionnaires monolingues (français, allemand, italien, anglais, espagnol), bilingues et multilingues en accès libre sur le web. Ce répertoire est complété par des listes d'abréviations et d'acronymes et par des répertoires géographiques, essentiellement des atlas. Marcel Grangier, responsable de la section française des services linguistiques, précise en janvier 2000: «Les Dictionnaires électroniques ne sont qu'une partie de l'ensemble, et d'autres secteurs documentaires ont trait à l'administration, au droit, à la langue française, etc., sans parler des informations générales. (…) Conçu d'abord comme un service intranet, notre site web se veut en premier lieu au service des traducteurs opérant en Suisse, qui souvent travaillent sur la même matière que les traducteurs de l'Administration fédérale, mais également, par certaines rubriques, au service de n'importe quel autre traducteur où qu'il se trouve. (…) Travailler sans internet est devenu tout simplement impossible. Au-delà de tous les outils et commodités utilisés (messagerie électronique, consultation de la presse électronique, activités de services au profit de la profession des traducteurs), internet reste pour nous une source indispensable et inépuisable d'informations dans ce que j'appellerais le "secteur non structuré" de la toile. Pour illustrer le propos, lorsqu'aucun site comportant de l'information organisée ne fournit de réponse à un problème de traduction, les moteurs de recherche permettent dans la plupart des cas de retrouver le chaînon manquant quelque part sur le réseau.»

Réputé lui aussi pour sa qualité, yourDictionary.com est cofondé par Robert Beard en 1999, dans le prolongement de son ancien site - A Web of Online Dictionaries - créé dès 1995. En septembre 2003, yourDictionary.com répertorie plus de 1.800 dictionnaires dans 250 langues, ainsi que de nombreux outils linguistiques: vocabulaires, grammaires, glossaires, méthodes de langues, etc. En avril 2007, le répertoire comprend 2.500 dictionnaires et grammaires dans 300 langues. Soucieux de servir toutes les langues sans exception, le site propose une section spécifique - Endangered Language Repository - consacrée aux langues menacées d'extinction.

Publiée par SIL International (SIL: Summer Institute of Linguistics), l'encyclopédie Ethnologue : Languages of the World existe à la fois en version web (gratuite), sur CD-Rom (payant) et en version imprimée (payante). Barbara Grimes, sa directrice de publication entre 1971 et 2000 (8e-14e éditions), relate en janvier 2000: «Il s'agit d'un catalogue des langues dans le monde, avec des informations sur les endroits où elles sont parlées, une estimation du nombre de personnes qui les parlent, la famille linguistique à laquelle elles appartiennent, les autres termes utilisés pour ces langues, les noms de dialectes, d'autres informations socio-linguistiques et démographiques, les dates des Bibles publiées, un index des noms de langues, un index des familles linguistiques et des cartes géographiques relatives aux langues.» En avril 2007, cette encyclopédie répertorie 6.912 langues selon plusieurs critères (pays, nom de la langue, code de la langue attribué par le SIL, famille de langues), avec moteur de recherche.

= Annuaires et portails

Le premier annuaire internet francophone est lancé par l'UREC (Unité réseaux du CNRS). Créé dès janvier 1994, cet annuaire recense d'abord les sites académiques avant d'offrir un contenu plus généraliste. Il permet aux usagers francophones de se familiariser avec le web sans se noyer dans la masse d'informations mondiale. Trois ans plus tard, la gestion de l'annuaire devient difficile du fait du nombre exponentiel de sites web, notamment de sites commerciaux. De plus, d'autres annuaires voient le jour dans l'intervalle, dont certains débutés avec l'aide de l'UREC. En juillet 1997, considérant que sa mission est accomplie, l'UREC arrête la mise à jour de cet annuaire généraliste. L'annuaire retourne à sa vocation première, à savoir un annuaire spécialisé consacré à l'enseignement supérieur et la recherche.

Patrick Rebollar est professeur de littérature française et d'informatique dans des universités japonaises. Dès 1987, il utilise l'ordinateur pour ses activités d'enseignement et de recherche. En 1994, il voit apparaître l'internet «dans le champ culturel et linguistique francophone». En 1996, il débute un site web de recherches et activités littéraires. Son site inclut une Chronologie littéraire 1848-1914 organisée par année. Une série de liens mène au texte intégral des oeuvres publiées cette année-là, avec des notes historiques, politiques, sociales, scientifiques, techniques et médicales, et des informations sur le monde littéraire de l'époque.

En juillet 1998, Patrick Rebollar raconte: «Pour la Chronologie littéraire, cela a commencé dans les premières semaines de 1997, en préparant un cours sur le roman fin de siècle (19e). Je rassemblai alors de la documentation et m'aperçus d'une part que les diverses chronologies trouvées apportaient des informations complémentaires les unes des autres, et d'autre part que les quelques documents littéraires alors présents sur le web n'étaient pas présentés de façon chronologique, mais toujours alphabétique. Je fis donc un document unique qui contenait toutes les années de 1848 à 1914, et l'augmentais progressivement. Jusqu'à une taille gênante pour le chargement, et je décidai alors, fin 1997, de le scinder en faisant un document pour chaque année. Dès le début, je l'ai utilisé avec mes étudiants, sur papier ou sur écran. Je sais qu'ils continuent de s'en servir, bien qu'ils ne suivent plus mon cours. J'ai reçu pas mal de courrier pour saluer mon entreprise, plus de courrier que pour les autres activités web que j'ai développées.»

Une autre activité web de Patrick Rebollar est la gestion de ses Signets, un répertoire très complet des sites francophones littéraires: littérature et recherche (normes et règles, bibliothèques et éditeurs, bibliographies), revues littéraires, linguistique, dictionnaires, lexiques, recherche littéraire, documents littéraires par thème et par auteur (Malraux, Sarraute, Camus, Gracq, Robbe-Grillet, etc.), oeuvres littéraires, poésie, bandes dessinées, etc. Quelle est l'origine de ces Signets? Patrick Rebollar relate en juillet 1998: «Animant des formations d'enseignants à l'Institut franco-japonais de Tokyo, je voyais d'un mauvais oeil d'imprimer régulièrement des adresses pour demander aux gens de les recopier. J'ai donc commencé par des petits documents rassemblant les quelques adresses web à utiliser dans chaque cours (avec Word), puis me suis dit que cela simplifierait tout si je mettais en ligne mes propres signets, vers la fin 1996. Quelques mois plus tard, je décidai de créer les sections finales de nouveaux signets afin de visualiser des adresses qui sinon étaient fondues dans les catégories. Cahin-caha, je renouvelle chaque mois.»

Une Autre Terre, portail de science-fiction, débute en novembre 1996. Fabrice Lhomme, son créateur, raconte en juin 1998: «J'ai commencé en présentant quelques bibliographies très incomplètes à l'époque et quelques critiques. Rapidement, j'ai mis en place les forums à l'aide d'un logiciel "maison" qui sert également sur d'autres actuellement. (…) Ensuite, le phénomène le plus marquant que je puisse noter, c'est la participation de plusieurs personnes au développement du serveur alors que jusque-là j'avais tout fait par moi-même. Le graphisme a été refait par un généreux contributeur et je reçois régulièrement des critiques réalisées par d'autres personnes. Pour ce qui est des nouvelles, la rubrique a eu du mal à démarrer mais une fois qu'il y en a eu un certain nombre, j'ai commencé à en recevoir régulièrement (effet d'entraînement). Actuellement, j'ai toutes les raisons d'être satisfait car mon site reçoit plus de 2.000 visiteurs différents chaque mois et toutes les rubriques ont une bonne audience. Le forum des visiteurs est très actif, ce qui me ravit. Concernant les perspectives d'avenir, j'envisage pour très bientôt d'ouvrir une nouvelle rubrique proposant des livres d'occasion à vendre avec l'ambition de proposer un gros catalogue. Eventuellement, j'ouvrirai aussi une rubrique présentant des biographies car je reçois pas mal de demandes de visiteurs en ce sens. (…) Si l'activité de vente de livres d'occasion se montre prometteuse, il est possible que j'en fasse une activité professionnelle sous la forme d'une micro-entreprise.»

Le Club des poètes est un site de poésie francophone qui souhaite la «bienvenue en territoire de poésie de la France au Chili, de Villon jusqu'à de jeunes poètes contemporains, en passant par toutes les grandes voix de la poésie de tous les temps et de tous les pays». Son webmestre, Blaise Rosnay, relate les débuts du site en juin 1998: «Le site du Club des Poètes a été créé en 1996, il s'est enrichi de nombreuses rubriques au cours des années et il est mis à jour deux fois par semaine. L'internet nous permet de communiquer rapidement avec les poètes du monde entier, de nous transmettre des articles et poèmes pour notre revue, ainsi que de garder un contact constant avec les adhérents de notre association. Par ailleurs, nous avons organisé des travaux en commun, en particulier dans le domaine de la traduction. Nos projets pour notre site sont d'y mettre encore et toujours plus de poésie. Ajouter encore des enregistrements sonores de poésie dite, ainsi que des vidéos de spectacles.»

Poésie française propose pour sa part un choix de poèmes allant de la Renaissance au début du 20e siècle. Claire Le Parco, de la société Webnet, raconte à la même date: «Nous avons créé ce site lors de la création de notre société, spécialisée dans la réalisation de sites internet et intranet. Nous sommes des informaticiens qui aimons la poésie, et nous avions envie de montrer que poésie et internet pouvaient faire bon ménage!»

Isabelle Aveline est d'abord libraire puis journaliste avant de se lancer dans la conception de sites internet et intranet. En juin 1996, elle fonde Zazieweb, un site indépendant conçu pour tous les amoureux du livre, professionnels et amateurs. Selon ses propres mots, «le site Zazieweb débarque sur la toile dans un no man's land littéraire». Le succès est immédiat. A l'époque, Zazieweb se présente comme une revue en ligne permettant de suivre l'actualité du livre sur le réseau, avec un graphisme d'Olivier Cornu. On y trouve un éditorial, une rubrique d'actualité, un agenda, une revue de presse, un annuaire des sites et un self-service multimédia.

Puis le site évolue. Sur une nouvelle mouture du site, Isabelle Aveline explique: «Zazieweb est un site World Wide Web professionnel et grand public indépendant, spécifiquement dédié aux libraires, éditeurs… et grand public de culture "livre". Conçu comme une librairie virtuelle, un espace de documentation, d'orientation et de ressources pour un public de culture "papier" s'intéressant à internet, il se situe aux frontières de l'écrit et de l'édition électronique. L'originalité du traitement des rubriques par rapport à un média papier étant évidemment de "mailler" l'information avec un site sur internet. C'est donc un site "passerelle" vers internet pour un public curieux et désorienté, avide de connaître ce qui se passe "de l'autre côté de l'écran".»

Quelques années plus tard, Zazieweb est un portail offrant de multiples services. Un annuaire recense 5.000 sites littéraires. Zazieweb offre aussi «des espaces d'échanges et de rencontres pour lecteurs communicants et actifs», avec la possibilité pour chacun de poster des nouvelles et des commentaires. Y participe une communauté active de plus de 10.000 membres appelés e-lecteurs. «Qu'est-ce qu'un e-lecteur? Un e-lecteur est un lecteur actif et communicant qui souhaite échanger, discuter, polémiquer avec d'autres lecteurs. Des espaces et services lui sont dédiés sur Zazieweb, sur le mode interactif du web ! Zazieweb se présente comme une interface média qui reconstruit, réinvente les relations entre les gens, entre les textes, entre toutes ces articulations possibles qui existent entre les personnes et les livres.»

8.2. Bases textuelles

= Quelques exemples

Le web favorise la création et la consultation de bases textuelles. Le laboratoire ATILF (Analyse et traitement informatique de la langue française) gère plusieurs bases textuelles payantes, par exemple Frantext, un corpus à dominante littéraire de textes français (16e-20e), ou encore l'Encyclopédie de Diderot, réalisée en collaboration avec le programme ARTFL (American and French Research on the Treasury of the French Language) de l'Université de Chicago. En accès libre, la section «Dictionnaires» de l'ATILF est une collection de dictionnaires informatisés comprenant les dictionnaires de Robert Estienne (1552), Jean Nicot (1606) et Pierre Bayle (1740), plusieurs éditions des dictionnaires de l'Académie française (1694, 1798, 1835, 1932-1935, 1992) et enfin le Trésor de la langue française informatisé (TLFi, 1971-1994).

Débutée en 1995 par l'Institut national de la langue française (INaLF, remplacé par le laboratoire ATILF en janvier 2001), la base Frantext, en accès payant, comprend en janvier 1998 180 millions de mots-occurrences résultant du traitement informatique de 3.500 unités textuelles en arts, sciences et techniques, une collection représentative couvrant cinq siècles (16e-20e). 82 centres de recherche et bibliothèques universitaires d'Europe, d'Australie, du Japon et du Canada y sont abonnés, ce qui représente 1.250 postes de travail, avec une cinquantaine d'interrogations de la base par jour.

L'ARTFL est un projet commun du CNRS (Centre national de la recherche scientifique, France) et de l'Université de Chicago (Illinois, Etats-Unis). L'ARTFL propose notamment une version en ligne exhaustive de la première édition (1751-1772) de l'Encyclopédie ou Dictionnaire raisonné des sciences, des métiers et des arts de Diderot et d'Alembert. 72.000 articles rédigés par plus de 140 collaborateurs (dont Voltaire, Rousseau, Marmontel, d'Holbach, Turgot, etc.) font de cette encyclopédie un monumental ouvrage de référence, avec 17 volumes de texte, 11 volumes de planches, 18.000 pages et 20,8 millions de mots. Destinée à rassembler puis divulguer les connaissances de l'époque, elle porte la marque des courants intellectuels et sociaux du Siècle des Lumières, dont elle aide à propager les idées.

En 1998, la base de données correspondant au premier volume est accessible sur le web en démonstration libre, à titre expérimental. La recherche est possible par mot, portion de texte, auteur ou catégorie, ou en combinant ces critères entre eux. On dispose de renvois d'un article à l'autre, et de liens permettant d'aller d'une planche au texte, ou d'aller du texte au fac-similé des pages originales. Il reste encore à corriger les erreurs typographiques et les erreurs d'identification dues à l'automatisation complète des procédures de saisie. Il reste aussi à compléter la recherche textuelle par la recherche d'images, envisagée par mot, portion de texte (légende) et catégorie. C'est chose faite dans les années qui suivent.

L'ARTFL propose également les versions en ligne du Dictionnaire de l'Académie française (1694-1935), de l'édition illustrée du Dictionnaire historique et critique de Philippe Bayle (1740), du Thresor de la langue française de Jean Nicot (1606), etc.

Autre exemple, très différent, et dû cette fois à une initiative individuelle: le site Rubriques à Bac. Créé en 1998 par Gérard Fourestier, diplômé en science politique et professeur de français à Nice, le site regroupe des bases de données à destination des lycéens et des étudiants. ELLIT (Eléments de littérature) propose des centaines d'articles sur la littérature française du 12e siècle à nos jours, ainsi qu'un répertoire d'auteurs. RELINTER (Relations internationales) recense 2.000 liens sur le monde contemporain depuis 1945. Ces deux bases de données sont accessibles par souscription, avec version de démonstration en accès libre. Lancé en juin 2001 dans le prolongement d'ELLIT, la base de données Bac-L (baccalauréat section lettres) est en accès libre.

En octobre 2000, Gérard Fourestier raconte: «Rubriques à Bac a été créé pour répondre au besoin de trouver sur le net, en un lieu unique, l'essentiel, suffisamment détaillé et abordable par le grand public, dans le but: a) de se forger avant tout une culture tout en préparant à des examens probatoires à des études de lettres - c'est la raison d'ELLIT (Eléments de littérature), base de données en littérature française; b) de comprendre le monde dans lequel nous vivons en en connaissant les tenants et les aboutissants, d'où RELINTER (Relations internationales). J'ai développé ces deux matières car elles correspondent à des études que j'ai, entre autres, faites en leur temps, et parce qu'il se trouve que, depuis une dizaine d'années, j'exerce des fonctions de professeur dans l'enseignement public (18 établissements de la 6e aux terminales de toutes sections et de tous types d'établissements). (…)

Mon activité liée à internet consiste tout d'abord à en sélectionner les outils, puis à savoir les manier pour la mise en ligne de mes travaux et, comme tout a un coût et doit avoir une certaine rentabilité, organiser le commercial qui permette de dégager les recettes indispensables ; sans parler du butinage indispensable pour la recherche d'informations qui seront ensuite traitées. (…) Mon initiative à propos d'internet n'est pas directement liée à mes fonctions de professeur. J'ai simplement voulu répondre à un besoin plus général et non pas étroitement scolaire, voire universitaire. Débarrassé des contraintes du programme, puisque j'agis en mon nom et pour mon compte et non "es-qualité", mais tout en donnant la matière grise qui me paraît indispensable pour mieux faire une tête qu'à la bien remplir, je laisse à d'autres le soin de ne préparer qu'à l'examen.»

Les recettes de Rubriques à Bac sont consacrées à la réalisation de projets éducatifs en Afrique. Par la suite, Gérard Fourestier aimerait développer des bases de données dans d'autres domaines, par exemple l'analyse sociétale, l'analyse sémantique ou l'écologie.

= Payant versus gratuit

Bases de données payantes à destination des organismes et des particuliers qui en ont les moyens, ou bases de données gratuites à la disposition de tous? Au début des années 2000, les outils dont on dispose pour créer et gérer des bases textuelles à moindres frais permettent de pencher vers la deuxième solution, tout au moins lorsqu'il existe une véritable volonté dans ce sens.

Emilie Devriendt, élève professeur à l'Ecole normale supérieure (ENS) de Paris, écrit en juin 2001: «L'avenir me semble prometteur en matière de publications de ressources en ligne, même si, en France tout au moins, bon nombre de résistances, inhérentes aux systèmes universitaire et éditorial, ne risquent pas de céder du jour au lendemain (dans dix, vingt ans, peut-être ?). Ce qui me donne confiance, malgré tout, c'est la conviction de la nécessité pratique d'internet. J'ai du mal à croire qu'à terme, un chercheur puisse se passer de cette gigantesque bibliothèque, de ce formidable outil. Ce qui ne veut pas dire que les nouvelles pratiques de recherche liées à internet ne doivent pas être réfléchies, mesurées à l'aune de méthodologies plus traditionnelles, bien au contraire. Il y a une histoire de l'"outillage", du travail intellectuel, où internet devrait avoir sa place.»

Professeur au département d'études françaises de l'Université de Toronto, Russon Wooldridge est le créateur de ressources littéraires librement accessibles en ligne. En 2001, sa tâche se trouve facilitée par TACTweb (TACT: text analysis computing tools). Développé par John Bradley, informaticien au King's College London (Royaume-Uni), et par Geoffrey Rockwell, professeur à la McMaster University (Canada), TACTweb est un logiciel de recherche de données textuelles en ligne. En mai 2001, Russon Wooldridge explique: «La dernière version de TACTweb permet dorénavant de construire des bases interactives importantes comme les dictionnaires de la Renaissance (Estienne et Nicot ; base RenDico), les deux principales éditions du Dictionnaire de l'Académie française (1694 et 1835), les collections de la Bibliothèque électronique de Lisieux (base LexoTor), les oeuvres complètes de Maupassant, ou encore les théâtres complets de Corneille, Molière, Racine, Marivaux et Beaumarchais (base théâtre 17e-18e). À la différence de grosses bases comme Frantext ou ARTFL nécessitant l'intervention d'informaticiens professionnels, d'équipes de gestion et de logiciels coûteux, TACTweb, qui est un gratuiciel que l'on peut décharger en ligne et installer soi-même, peut être géré par le chercheur individuel créateur de ressources textuelles en ligne.»

Autre exemple, le projet HyperNietzsche, lancé en 2000 sous la direction de Paolo d'Iorio, chargé de recherches à l'Institut des textes et manuscrits modernes (ITEM) du CNRS. Ce projet expérimental «vise à créer une infrastructure de travail collectif en réseau, lit-on sur le site web. Cette infrastructure sera d'abord appliquée et testée sur l'oeuvre de Nietzsche, pour être ensuite généralisable à d'autres auteurs, à l'étude d'une période historique ou d'un fonds d'archive, ou à l'analyse d'un problème philosophique. Il ne s'agit donc pas seulement d'un projet de numérisation et de mise en réseau d'un ensemble de textes et d'études sur Nietzsche, ni d'une édition électronique conçue comme un produit confectionné et offert à la consultation, mais plutôt d'un instrument de travail permettant à une communauté savante délocalisée de travailler de façon coopérative et cumulative et de publier les résultats de son travail en réseau, à l'échelle de la planète. Il ne s'agit pas seulement d'une bibliothèque de textes électroniques en ligne, plus ou moins bien indexée, accompagnée d'un moteur de recherche par mots-clés ou en texte intégral. C'est un véritable système hypertextuel qui permet tout d'abord de disposer les textes et les manuscrits de Nietzsche selon des ordonnancements chronologiques, génétiques ou thématiques, et surtout d'activer un ensemble de liens hypertextuels qui relient les sources primaires aux essais critiques produits par les chercheurs.» Le texte intégral consacré à la présentation du projet est disponible pendant deux ans en accès libre sur le site des PUF (Presses universitaires de France). Son équivalent imprimé est publié en octobre 2000 dans la série «Ecritures électroniques» de la collection «Que sais-je?».

En février 2003, Emilie Devriendt fait à nouveau le point: «Dans ce domaine que l'on appelle parfois l'informatique littéraire, deux aspects du texte électronique m'intéressent plus particulièrement, dans une perspective d'enseignement ou de recherche: la publication de ressources textuelles, par exemple littéraires, sur le web au format texte ou au format image (exemple: Gallica ou la Bibliothèque électronique de Lisieux); la publication de bases de données textuelles interactives, c'est à dire d'outils de recherche et d'analyse linguistique appliqués à des textes électroniques donnés (exemple: la Nefbase du Net des études françaises ou, si l'on veut citer une banque de données payante, Frantext). Aujourd'hui ce type de ressources est relativement bien développé (même si aucune "explosion" ne semble avoir eu lieu si l'on compare la situation actuelle à celle d'il y a deux ou trois ans). En revanche, on ne peut véritablement mesurer les usages qui en sont faits.»

8.3. Catalogues collectifs

= Premiers pas

Par le passé, on a pu reprocher aux catalogues de bibliothèques d'être austères, peu conviviaux, et surtout de donner les références du document mais en aucun cas l'accès au contenu. Depuis qu'ils sont disponibles sur l'internet, les catalogues sont moins austères et plus conviviaux. Et surtout - rêve de tous qui commence à devenir réalité - ils permettent l'accès aux documents eux-mêmes : textes et images dans un premier temps, extraits sonores et vidéos dans un deuxième temps. En 1998, les 2.500 oeuvres de l'Universal Library sont accessibles par le biais d'un système expérimental (ESS: experimental search system) intégré ensuite au catalogue en ligne de la Library of Congress.

L'avenir des catalogues en réseau tient à l'harmonisation du format MARC (machine readable cataloguing) par le biais de l'UNIMARC (universal machine readable cataloguing). Créé en 1977 par l'IFLA (International Federation of Library Associations), le format UNIMARC est un format universel permettant le stockage et l'échange de notices bibliographiques au moyen d'une codification des différentes parties de la notice (auteur, titre, éditeur, etc.) pour traitement informatique. Ce format favorise les échanges de données entre la vingtaine de formats MARC existants, qui correspondent chacun à une pratique nationale de catalogage (INTERMARC en France, UKMARC au Royaume-Uni, USMARC aux Etats-Unis, CAN/MARC au Canada, etc.). Les notices dans le format MARC d'origine sont d'abord converties au format UNIMARC avant d'être converties à nouveau dans le format MARC de destination. UNIMARC peut aussi être utilisé comme standard pour le développement de nouveaux formats MARC.

Dans le monde anglophone, la British Library (qui utilise UKMARC), la Library of Congress (qui utilise USMARC) et la Bibliothèque nationale du Canada (qui utilise CAN/MARC) décident d'harmoniser leurs formats MARC nationaux. Un programme de trois ans (décembre 1995 - décembre 1998) permet de mettre au point un format MARC commun aux trois bibliothèques.

Parallèlement, en 1996, dans le cadre de son Programme des bibliothèques, la Commission européenne promeut l'utilisation du format UNIMARC comme format commun d'échange entre tous les formats MARC utilisés dans les pays de l'Union européenne. Le groupe de travail correspondant étudie aussi les problèmes posés par les différentes polices de caractères, ainsi que la manière d'harmoniser le format bibliographique, tout comme le format du document lui-même pour les documents disponibles en ligne.

A la fin des années 1990, de plus en plus de catalogues sont disponibles sur le web, moyennant une interface spécifique. L'usager a souvent le choix entre deux types de recherche, simple et avancée, et il peut sélectionner plusieurs critères complémentaires tels que le nombre de notices souhaitées ou bien le mode de classement. A réception du résultat, il dispose de plusieurs pages de notices abrégées ou complètes. Les notices sélectionnées peuvent être copiées, imprimées, sauvegardées ou bien envoyées par courriel. Des liens hypertextes permettent de passer facilement d'une requête à l'autre.

Ces catalogues utilisent le protocole Z39.50, un standard de communication permettant de chercher et récupérer des informations bibliographiques dans des bases de données en ligne. Ce protocole est d'abord utilisé par le WAIS (wide area information servers), un système de recherche créé au début des années 1990 pour consulter les index de bases de données situées sur des serveurs consultables à distance, avant l'apparition des moteurs de recherche sur le web. La version du Z39.50 en cours (norme ISO 23950: 1998) est utilisée par les grands catalogues de bibliothèques disponibles sur le web, notamment par celui de la Library of Congress. Ce protocole est également promu par la Commission européenne pour favoriser son utilisation dans les pays de l'Union européenne.

Tous deux en accès libre, les catalogues de la British Library et de la Library of Congress sont d'excellents outils bibliographiques à l'échelon mondial. En mai 1997, la British Library lance son OPAC 97 (OPAC: online public access catalogue), un catalogue en ligne permettant l'accès aux catalogues de ses principales collections à Londres et à Boston Spa, soit 150 millions de documents rassemblés depuis 250 ans. Catalogue expérimental, l'OPAC 97 est ensuite remplacé par sa version définitive, le BLPC (British Library public catalogue). Quant au catalogue de la Library of Congress, avec menus en anglais et en espagnol, il s'agit du plus important catalogue en ligne au monde, avec un grand nombre de notices en français.

Les catalogues collectifs visent à faire connaître les ressources disponibles à l'échelon local, régional, national et international. C'est le cas par exemple du Catalogue collectif de France (CCFr), mis en chantier en juillet 1997, qui permet de «trouver des informations détaillées sur les bibliothèques françaises, leurs collections et leurs fonds (anciens, locaux ou spécifiques), connaître précisément les services qu'elles rendent et interroger leur catalogue en ligne». A terme, annonce-t-on en 1998, il permettra aussi de «localiser des ouvrages (documents imprimés, audio, vidéo, multimédia) dans les principales bibliothèques et demander le prêt ou la reproduction» de documents qui seront remis à l'usager dans la bibliothèque de son choix. C'est chose faite en novembre 2002. En juillet 2001, la gestion du CCFr est confiée à la Bibliothèque nationale de France (BnF). Le CCFr regroupe les catalogues de la BnF et des bibliothèques universitaires, ainsi que les catalogues des fonds anciens (avant 1811) et locaux des bibliothèques municipales et spécialisées. En décembre 2006, le CCFr permet de localiser 15 millions de documents dans 160 bibliothèques françaises.

= WorldCat et RedLightGreen

L'internet facilite la gestion de catalogues collectifs mondiaux. Le but premier de ces catalogues est d'éviter de cataloguer à nouveau un document déjà catalogué par une bibliothèque partenaire. Si le catalogueur trouve la notice du livre qu'il est censé cataloguer, il la copie pour l'inclure dans le catalogue de sa propre bibliothèque. S'il ne trouve pas la notice, il la crée, et cette notice est aussitôt disponible pour les catalogueurs officiant dans d'autres bibliothèques. Ce pari osé est tenté par deux associations, l'OCLC (Online Computer Library Center) dès 1971 et le RLG (Research Libraries Group) dès 1980. Quelque trente ans plus tard, l'OCLC et le RLG gèrent de gigantesques bases bibliographiques alimentées par leurs adhérents, permettant ainsi aux bibliothécaires d'unir leurs forces par-delà les frontières.

Fondée en 1967 dans l'Ohio (Etats-Unis), l'OCLC gère l'OCLC Online Union Catalog, débuté en 1971 pour desservir les bibliothèques universitaires de l'Etat de l'Ohio. Ce catalogue collectif s'étend ensuite à tout le pays, puis au monde entier. Désormais appelé WorldCat, et disponible sur abonnement payant, il comprend en 1998 38 millions de notices en 370 langues, avec translittération pour les caractères non romains des langues JACKPHY (japonais, arabe, chinois, coréen, persan, hébreu et yiddish). L'accroissement annuel est de 2 millions de notices. WorldCat utilise huit formats bibliographiques correspondant aux catégories suivantes: livres, périodiques, documents visuels, cartes et plans, documents mixtes, enregistrements sonores, partitions, documents informatiques. En 2005, 61 millions de notices bibliographiques produites par 9.000 bibliothèques et centres de documentation sont disponibles dans 400 langues. En 2006, 73 millions de notices provenant de 10.000 bibliothèques dans 112 pays permettent de localiser un milliard de documents. Une notice type contient la description du document ainsi que des informations sur son contenu: table des matières, résumé, couverture, illustrations et courte biographie de l'auteur.

Devenue la plus grande base mondiale de données bibliographiques, WorldCat migre progressivement sur le web, d'abord en rendant la consultation des notices possible par le biais de plusieurs moteurs de recherche (Yahoo!, Google et bien d'autres), puis en lançant en août 2006 une version web (bêta) de WorldCat en accès libre, avec en sus un accès direct aux documents électroniques des bibliothèques membres: livres du domaine public, articles, photos, livres audio, musique et vidéos.

Fondé en 1980 en Californie, avec une antenne à New York, le RLG (Research Library Group, qui devient ensuite le Research Libraries Group) se donne pour but d'améliorer l'accès à l'information dans le domaine de l'enseignement et de la recherche. Le RLG débute son propre catalogue sous le nom de RLIN (Research Libraries Information Network). Contrairement à WorldCat qui n'accepte qu'une notice par document, RLIN accepte plusieurs notices pour un même document. En 1998, RLIN comprend 82 millions de notices dans 365 langues, avec des notices translittérées pour les documents publiés dans les langues JACKPHY et en cyrillique. Des centaines de dépôts d'archives, bibliothèques de musées, bibliothèques universitaires, bibliothèques publiques, bibliothèques de droit, bibliothèques techniques, bibliothèques d'entreprise et bibliothèques d'art utilisent RLIN pour le catalogage, le prêt inter-bibliothèques et le contrôle des archives et des manuscrits. Une des spécialités de RLIN est l'histoire de l'art. Alimentée par 65 bibliothèques spécialisées, une section spécifique comprend 100.000 notices de catalogues d'expositions et 168.500 notices de documents iconographiques (photographies, diapositives, dessins, estampes et affiches). Cette section inclut aussi les 110.000 notices de la base bibliographique Scipio, consacrée aux catalogues de ventes.

En 2003, RLIN change de nom pour devenir le RLG Union Catalog, qui comprend désormais 126 millions de notices bibliographiques correspondant à 42 millions de documents (livres, cartes, manuscrits, films, bandes sonores, etc.). Au printemps 2004, une version web du catalogue est disponible en accès libre sous le nom de RedLightGreen, suite à une phase pilote lancée à l'automne 2003. La mise en ligne de RedLightGreen inaugure une ère nouvelle. C'est en effet la première fois qu'un catalogue collectif mondial est en accès libre. Destiné en premier lieu aux étudiants du premier cycle universitaire, RedLightGreen propose 130 millions de notices, avec des liens vers des informations spécifiques aux bibliothèques d'un campus donné (cote, version en ligne si celle-ci existe, etc.). Après trois ans d'activité, en novembre 2006, les usagers sont invités à utiliser WorldCat, dont la version web (bêta) est en accès libre depuis août 2006. A la même date, le RLG est intégré à OCLC.

8.4. Chronologie

* Cette chronologie ne prétend pas à l'exhaustivité.

1967: Fondation d'OCLC (Online Computer Library Center).

1971: Débuts de l'OCLC Online Union Catalog, qui deviendra WorldCat.

1977: Lancement de l'UNIMARC, format universel de catalogage.

1980: Débuts du RLG (Research Libraries Group) et de son catalogue RLIN (Research Libraries Information Network).

1994: Travlang, répertoire de dictionnaires de langues créé par Michael Martin.

1994 (janvier): Annuaire de l'UREC (Unité réseaux du CNRS).

1995: Frantext, base textuelle de l'Institut national de la langue française (INaLF).

1995: A Web of Online Dictionaries, créé par Robert Beard.

1996: Adoption de l'UNIMARC par la Communauté européenne.

1996: Site de recherches et activités littéraires de Patrick Rebollar.

1996: Une Autre Terre, portail de science-fiction, créé par Fabrice Lhomme.

1996 (juin): Zazieweb, site d'actualité littéraire créé par Isabelle Aveline.

1997 (mai): OPAC (online public access catalogue) de la British Library.

1997 (juillet): Débuts du Catalogue collectif de France (CCFr).

1997 (décembre): Outils linguistiques de la société de traduction Logos.

1998: Rubriques à Bac, site créé par Gérard Fourestier.

1998: ESS (experimental search system) de la Library of Congress.

1999: yourDictionary.com, portail cofondé par Robert Beard.

1999 (décembre): WebEncyclo, première encyclopédie francophone en accès libre.

1999 (décembre): Britannica.com, première encyclopédie anglophone en accès libre.

1999 (décembre): Mise en ligne de l'Encyclopaedia Universalis.

2000: Mise en ligne du Quid.

2000: HyperNietzsche, lancé sous la direction de Paolo d'Iorio.

2000 (mars): Mise en ligne de l'Oxford English Dictionary.

2000 (septembre): L'encyclopédie Encarta de Microsoft en accès libre.

2000 (septembre): Mise en ligne du Grand dictionnaire terminologique (GDT) par l'Office québécois de la langue française (OQLF).

2001 (janvier): Laboratoire ATILF (Analyse et traitement informatique de la langue française).

2001 (janvier): Wikipedia, grande encyclopédie coopérative fondée par Jimmy Wales et Larry Sanger.

2003: RLIN devient le RLG Union Catalog, puis le RedLightGreen.

2004 (printemps): RedLightGreen, premier catalogue collectif mondial en accès libre.

2006 (août): Le catalogue collectif mondial WorldCat en accès libre en version bêta.

2006 (novembre): Disparition de RedLightGreen, et fusion du RLG avec l'OCLC.

2007 (mars): Citizendium, grande encyclopédie collaborative en ligne fondée par Larry Sanger.

2007 (mai): Encyclopedia of Life, grande encyclopédie collaborative des sciences de la vie fondée par un consortium.

9. LE LIVRE NUMERIQUE

[9.1. Formats de lecture / PDF - Adobe Reader / OeB (Open eBook) / LIT - Microsoft Reader / PRC - Mobipocket Reader / PDB - Palm Reader / BRF (braille format) / DAISY - livre audio // 9.2. Une tâche titanesque / Une voie tracée par la presse / Divers canaux de diffusion / Une progression régulière // 9.3. Chronologie]

Si le livre numérique commercial naît en mai 1998, il ne se développe véritablement qu'à compter du deuxième semestre 2000, en tant que mode de diffusion complémentaire de l'imprimé. De plus en plus de titres sont disponibles en deux versions, imprimée et numérique, puis, au fil des ans, uniquement en version numérique. Tout comme la version imprimée, la version numérique se décline en plusieurs formats, y compris au format braille et audio. En 2007, on compte des dizaines de milliers de livres numériques lisibles sur ordinateur, PDA, téléphone, smartphone et tablette électronique.

9.1. Formats de lecture

Un format de lecture correspond à un logiciel donné. Un logiciel de lecture permet de lire à l'écran un livre numérique tout en bénéficiant des fonctionnalités suivantes: navigation hypertexte au sein du livre ou vers le web, changement de la taille et de la police des caractères, surlignage de certains passages, recherche de mots dans l'ensemble du texte, ajout de signets ou de notes personnelles, choix de l'affichage en mode paysage ou portrait, agrandissement des figures et graphiques, sommaire affiché en permanence, et enfin formatage automatique du livre et de sa pagination en fonction de la taille de l'écran (ce qu'on appelle le reflowing). Lancés en 2001 pour contrôler l'accès aux livres numériques sous droits, des systèmes de DRM (digital rights management) permettent la gestion des droits numériques en fonction des consignes données par l'éditeur.

= PDF / Adobe Reader

Lancé en juin 1993 par la société Adobe et diffusé gratuitement, le premier logiciel de lecture du marché est l'Acrobat Reader, qui permet de lire des documents au format PDF (portable document format). Ce format permet de figer les documents numériques dans une présentation donnée, pour conserver les polices, les couleurs et les images du document source, quelle que soit la plateforme utilisée pour le créer et pour le lire. Vendu en parallèle, le logiciel Adobe Acrobat permet de convertir n'importe quel document au format PDF.

Au fil des ans, le format PDF devient la norme internationale de diffusion des documents électroniques, pour impression ou pour transfert d'une plateforme à l'autre. Des millions de documents PDF sont présents sur le web pour lecture ou téléchargement, ou bien transitent par courriel sous forme de fichier attaché. L'Acrobat Reader pour ordinateur est progressivement disponible dans plusieurs langues et pour diverses plateformes (Windows, Mac, Linux, Unix). En 2001, Adobe lance également un Acrobat Reader pour assistant personnel (PDA), utilisable sur le Palm Pilot (en mai 2001) puis sur le Pocket PC (en décembre 2001).

Face à la concurrence représentée par le Microsoft Reader (lancé en avril 2000), Adobe annonce en août 2000 l'acquisition de la société Glassbook, spécialisée dans les logiciels de distribution de livres numériques à destination des éditeurs, des libraires, des distributeurs et des bibliothèques. Adobe passe aussi un partenariat avec Amazon.com et Barnes & Noble.com afin de proposer des titres lisibles sur l'Acrobat Reader et le Glassbook Reader.

En janvier 2001, Adobe met sur le marché deux nouveaux logiciels. Le premier, gratuit, est l'Acrobat eBook Reader. Il permet de lire les fichiers PDF de livres numériques sous droits, avec gestion des droits par l'Adobe Content Server. Il permet aussi d'ajouter des notes et des signets, de choisir l'orientation de lecture des livres (paysage ou portrait), ou encore de visualiser leur couverture dans une bibliothèque personnelle. Il utilise la technique d'affichage CoolType et comporte un dictionnaire intégré. Le deuxième logiciel, payant, est l'Adobe Content Server, destiné aux éditeurs et distributeurs. Il s'agit d'un logiciel serveur de contenu assurant le conditionnement, la protection, la distribution et la vente sécurisée de livres numériques au format PDF. Ce système de gestion des droits numériques (DRM) permet de contrôler l'accès aux livres numériques sous droits, et donc de gérer les droits d'un livre selon les consignes données par le gestionnaire des droits, par exemple en autorisant ou non l'impression ou le prêt. En avril 2001, Adobe conclut un partenariat avec la grande librairie en ligne Amazon, qui met en vente 2.000 livres numériques lisibles sur l'Acrobat eBook Reader : titres de grands éditeurs, guides de voyages, livres pour enfants, etc.

En dix ans, entre 1993 et 2003, l'Acrobat Reader aurait été téléchargé 500 millions de fois. Ce logiciel gratuit est désormais disponible dans de nombreuses langues et pour de nombreuses plateformes (Windows, Mac, Linux, Unix, Palm OS, Pocket PC, Symbian OS, etc.). En mai 2003, l'Acrobat Reader (5e version) fusionne avec l'Acrobat eBook Reader (2e version) pour devenir l'Adobe Reader (débutant à la version 6), qui permet de lire aussi bien les fichiers PDF standard que les fichiers PDF sécurisés.

Fin 2003, Adobe ouvre sa librairie en ligne, dénommée Digital Media Store, avec les titres au format PDF de grands éditeurs (HarperCollins Publishers, Random House, Simon & Schuster, etc.) et des versions électroniques de journaux et magazines (The New York Times, Popular Science, etc.). Adobe lance aussi Adobe eBooks Central, un service permettant de lire, publier, vendre et prêter des livres numériques, et l'Adobe eBook Library, qui se veut un prototype de bibliothèque de livres numériques. Très complet, le site Planet PDF permet de suivre l'actualité du PDF. En novembre 2004, l'Adobe Content Server est remplacé par l'Adobe LiveCycle Policy Server. Les versions récentes d'Adobe Acrobat permettent de créer des PDF compatibles avec le standard Open eBook (OeB).

= OeB (Open eBook)

Les années 1998 et 1999 sont marquées par la prolifération des formats, dans le cadre d'un marché naissant promis à une expansion rapide. Aux formats classiques - format texte, Word, HTML (hypertext markup language), XML (extensible markup language) et PDF (portable document format) - s'ajoutent des formats propriétaires créés par plusieurs sociétés pour une lecture sur leurs propres logiciels: Glassbook Reader, Rocket eBook Reader, Peanut Reader, Franklin Reader, logiciel de lecture Cytale, Gemstar eBook Reader, Palm Reader, etc., ces logiciels correspondant le plus souvent à un appareil donné: Rocket eBook, eBookMan (Franklin), Cybook (Cytale), Gemstar eBook, Palm Pilot, etc.

Inquiets pour l'avenir du livre numérique qui, à peine né, propose presque autant de formats que de titres, certains insistent sur l'intérêt, sinon la nécessité, d'un format unique. A l'instigation du NIST (National Institute of Standards and Technology, Etats-Unis) naît en juin 1998 l'Open eBook Initiative, qui constitue un groupe de travail de 25 personnes (Open eBook Authoring Group). Ce groupe élabore l'OeB (open ebook), un format basé sur le langage XML pour normaliser le contenu, la structure et la présentation des livres numériques. Le format OeB est défini par l'OeBPS (open ebook publication structure), dont la version 1.0 est disponible en septembre 1999. L'OeB est un format ouvert et gratuit appartenant au domaine public. Le format original est toutefois utilisé uniquement par les professionnels de la publication, puisqu'il doit être associé à un système de gestion des droits numériques (DRM).

Fondé en janvier 2000 à la suite de l'Open eBook Initiative, l'Open eBook Forum (OeBF) est un consortium industriel international regroupant constructeurs, concepteurs de logiciels, éditeurs, libraires et spécialistes du numérique (85 participants en 2002) pour développer le format OeB et définir les versions successives de l'OeBPS. En avril 2005, l'OeBF change de nom pour devenir l'IDPF (International Digital Publishing Forum). La version en cours de l'OeBPS date de décembre 2006.

= LIT / Microsoft Reader

Lancé en avril 2000, le Microsoft Reader est un logiciel permettant la lecture de livres numériques au format LIT (abrégé du terme anglais «literature»), lui-même basé sur le format OeB. Dans un premier temps, le Microsoft Reader équipe uniquement le Pocket PC, l'assistant personnel lancé à la même date par Microsoft. Quatre mois plus tard, en août 2000, il est utilisable sur toute plateforme Windows, et donc aussi bien sur ordinateur que sur assistant personnel. Ses caractéristiques sont un affichage utilisant la technologie Cleartype, le choix de la taille des caractères, la mémorisation des mots-clés pour des recherches ultérieures, et l'accès d'un clic au Merriam-Webster Dictionary.

Ce logiciel étant téléchargeable gratuitement, Microsoft facture les éditeurs et distributeurs pour l'utilisation de sa technologie de gestion des droits numériques (DRM), et touche une commission sur la vente de chaque titre. La gestion des droits numériques s'effectue au moyen du Microsoft DAS Server (DAS: digital asset server). Microsoft passe aussi des partenariats avec les grandes librairies en ligne - Barnes & Noble.com en janvier 2000 puis Amazon.com en août 2000 - pour la vente de livres numériques lisibles sur le Microsoft Reader. Barnes & Noble.com ouvre son secteur numérique en août 2000, suivi par Amazon.com en novembre 2000. En novembre 2002, le Microsoft Reader est disponible pour tablette PC, dès la commercialisation de cette nouvelle machine par 14 fabricants.

= PRC / Mobipocket Reader

Face à Adobe et Microsoft, un nouvel acteur s'impose rapidement sur le marché, sur un créneau bien spécifique, la lecture sur assistant personnel (PDA). Créée à Paris en mars 2000 par Thierry Brethes et Nathalie Ting, la société Mobipocket est financée en partie par Viventures, branche de la multinationale Vivendi. Mobipocket conçoit le logiciel de lecture Mobipocket Reader, qui permet la lecture de fichiers au format PRC (Palm resource). Gratuit et disponible en plusieurs langues (français, anglais, allemand, espagnol, italien), il est «universel», c'est-à-dire utilisable sur tout assistant personnel. En octobre 2001, le Mobipocket Reader reçoit l'eBook Technology Award de la Foire internationale du livre de Francfort. A la même date, Franklin passe un partenariat avec Mobipocket pour l'installation du Mobipocket Reader sur l'eBookMan, l'assistant personnel multimédia de Franklin, au lieu du partenariat prévu à l'origine entre Franklin et Microsoft pour l'installation du Microsoft Reader.

Si le Mobipocket Reader est gratuit, d'autres logiciels Mobipocket sont payants. Le Mobipocket Web Companion est un logiciel d'extraction automatique de contenu auprès des sites de presse partenaires. Le Mobipocket Publisher permet aux particuliers (qui ont le choix entre une version privée gratuite et une version standard payante) et aux éditeurs (version professionnelle payante) de créer des livres numériques sécurisés utilisant la technologie Mobipocket DRM, afin de contrôler l'accès aux livres numériques sous droits. Dans un souci d'ouverture aux autres formats, le Mobipocket Publisher permet de créer des livres numériques non seulement au format PRC, lu par le Mobipocket Reader, mais aussi au format LIT, lu par le Microsoft Reader.

En avril 2002, la société lance une version du Mobipocket Reader pour ordinateur personnel. Au printemps 2003, le Mobipocket Reader équipe tous les assistants personnels du marché, à savoir les gammes Palm Pilot, Pocket PC, eBookMan et Psion, et les smartphones de Nokia et Sony Ericsson. A la même date, le nombre de livres lisibles sur le Mobipocket Reader se chiffre à 6.000 titres dans plusieurs langues (français, anglais, allemand, espagnol), distribués soit sur le site de Mobipocket soit dans les librairies partenaires.

= PDB / Palm Reader

En mars 1996, la société Palm lance le Palm Pilot, un assistant personnel (PDA) dont le succès est immédiat. Son système d'exploitation est le Palm OS, développé par PalmSource, une division de Palm. Sept ans après, malgré la concurrence de la gamme Pocket PC de Microsoft - lancée en avril 2000 - et des modèles de Hewlett-Packard, Sony, Handspring, Toshiba et Casio, le Palm Pilot reste l'assistant personnel le plus utilisé au monde, avec 23 millions de machines vendues entre 1996 et 2002. Quant au Palm OS, il équipe 55% des assistants personnels vendus en 2002, l'autre grande plateforme étant le système d'exploitation Pocket PC de Microsoft, avec un pourcentage de 25,7%.

En mars 2001, Palm aborde le marché du livre numérique en faisant l'acquisition de Peanutpress.com, éditeur et distributeur de livres numériques pour assistant personnel, qui appartenait jusque-là à la société netLibrary. Le Peanut Reader devient le Palm Reader, et le format correspondant devient le format PDB (Palm database). D'abord utilisable uniquement sur les gammes Palm et Pocket PC, le Palm Reader est utilisable sur ordinateur en juillet 2002. Le Palm Pilot est équipé des logiciels de lecture Palm Reader et Mobipocket Reader.

Lors du rachat de Peanutpress.com par Palm en mars 2001, les 2.000 titres numériques de Peanutpress.com - des best-sellers et des titres de grands éditeurs - sont transférés dans la librairie numérique Palm Digital Media. A la même date, le roman Dreamcatcher de Stephen King, dont on connaît l'intérêt pour le numérique, sort simultanément en version imprimée chez Simon & Schuster et en version numérique chez Palm Digital Media. Sont disponibles aussi chez Palm les versions numériques des best-sellers de Michael Connelly, Michael Crichton, Anne Rice et Scott Turow, ainsi que le Wall Street Journal et plusieurs magazines. En mars 2002, Everything's Eventual, le nouveau recueil de nouvelles de Stephen King, est lancé simultanément par Scribner, une subdivision de Simon & Schuster, et par Palm Digital Media, qui en propose un extrait en téléchargement libre. En juillet 2002, les collections de Palm Digital Media se chiffrent à 5.500 titres dans plusieurs langues. En 2003, le catalogue approche les 10.000 titres. Palm Digital Media devient ensuite le Palm eBook Store.

= BRF (braille format)

Alphabet tactile inventé en 1829 par le français Louis Braille, le braille est le seul système d'écriture accessible aux aveugles. Il s'agit d'un système de six points composé de deux colonnes de trois points. La combinaison de ces six points permet de former toutes les lettres de l'alphabet, les signes de ponctuation et les symboles. Le braille est d'abord embossé sur papier au moyen d'une tablette et d'un poinçon. A partir de la fin des années 1970, il est produit à l'aide d'un afficheur braille piézo-électrique. A cet afficheur succède la machine Perkins avec son clavier de six touches. Puis apparaît le matériel informatique, par exemple le bloc-notes braille, qui sert à la fois de machine à écrire le braille et, quand il est connecté à un ordinateur, d'écran tactile permettant de lire l'écran de l'ordinateur. Le braille informatique peut s'afficher sur huit points, ce qui permet d'augmenter par quatre le nombre de combinaisons possibles.

Le document numérique permettant de dissocier contenu et présentation, on peut désormais influer sur cette dernière en changeant la taille et la police des caractères, en inversant les contrastes, en supprimant la couleur ou en la modifiant, afin de faciliter la lecture des personnes malvoyantes. Les personnes aveugles peuvent convertir le contenu au format BRF ou alors au format DAISY pour lecture sur synthèse vocale.

= DAISY / livre audio

Quelle est l'origine du format DAISY, acronyme de «digital audio information system» puis de «digital accessible information system»?

Depuis trente ans sinon plus, les personnes ayant un problème visuel peuvent écouter des livres sur bandes magnétiques ou sur cassettes, enregistrés au fil des ans par des centaines de bénévoles. Elles peuvent aussi se procurer en librairie des livres audio sur cassettes et - plus récemment - sur CD-Rom. Certains éditeurs proposent en effet une petite série de titres parfois enregistrés par les auteurs eux-mêmes.

Fait récent, les technologies numériques permettent désormais de convertir automatiquement un document numérique en «voix» pour lecture sur synthèse vocale.

Si les techniques de synthèse vocale s'améliorent, de l'avis de certains, rien ne remplace une vraie voix, c'est-à-dire une voix humaine, moins parfaite peut-être, mais vivante, avec des nuances, des intonations, des inflexions, etc. Or de nombreux organismes disposent d'enregistrements réalisés en analogique (à savoir sur bandes magnétiques et sur cassettes) par des bénévoles. La numérisation de tous ces enregistrements permettrait de les utiliser non seulement dans la communauté desservie mais partout ailleurs. D'une part chaque organisme pourrait accroître ses collections de manière exponentielle, d'autre part de nouvelles bibliothèques audio pourraient être créées à moindre coût, notamment dans les pays en développement.

Plusieurs organismes spécialisés décident d'unir leurs forces pour oeuvrer en commun. Ils fondent en mai 1996 le DAISY Consortium, un consortium international chargé d'assurer la transition entre le livre audio analogique et le livre audionumérique. Sa tâche est immense: définir une norme internationale, déterminer les conditions de production, d'échange et d'utilisation du livre audionumérique, organiser la numérisation du matériel audio à l'échelle mondiale. Les activités du consortium sont peu à peu mises en place: définition des normes de spécification de fichiers à partir de celles du World Wide Web Consortium (W3C), conception de logiciels de conversion des bandes son analogiques en bandes son numériques, gestion d'ensemble de la production, échange de livres audionumériques entre bibliothèques, définition d'une loi internationale du droit d'auteur pour les personnes atteintes de déficience visuelle, protection des documents soumis au droit d'auteur, et enfin promotion de la norme DAISY à l'échelle mondiale.

La norme DAISY se base sur le format DTB (digital talking book), qui permet l'indexation du livre audio et l'ajout de signets pour une navigation facile au niveau du paragraphe, de la page ou du chapitre. Près de 41.000 livres audio répondent à cette norme en mars 2003, 104.100 livres audio en mars 2004 et 129.650 livres audio en août 2005. D'autres formats possibles sont les standards de compression audio utilisés pour la musique, comme le MP3 ou le WMA (Windows media audio). En 2007, les collections enregistrées de livres du domaine public sont nombreuses, et le plus souvent en accès libre, par exemple AudioLivres (en français), LiteralSystems (en anglais), AudioBooksForFree (en anglais) et LibriVox (multilingue).

9.2. Une tâche titanesque

= Une voie tracée par la presse

Le développement de la presse en ligne (dans les années 1990) est intéressant parce qu'il préfigure celui du livre en ligne (dans les années 2000). Raison pour laquelle on l'expose brièvement ici.

Au début des années 1990, les premières éditions électroniques de journaux sont disponibles par le biais de services commerciaux tels que America Online ou CompuServe. Suite à l'apparition du premier navigateur fin 1993 et à la croissance rapide du web qui s'ensuit, les organes de presse créent leurs propres sites. Au Royaume-Uni, le Times et le Sunday Times font web commun sur un site dénommé Times Online, avec possibilité de créer une édition personnalisée. Aux Etats-Unis, la version en ligne du Wall Street Journal est payante, avec 100.000 abonnés en 1998. Celle du New York Times est disponible sur abonnement gratuit. Le Washington Post propose l'actualité quotidienne en ligne et de nombreux articles archivés, le tout avec images, sons et vidéos. Pathfinder (rebaptisé ensuite Time) est le site web du groupe Time-Warner, éditeur de Time Magazine, Sports Illustrated, Fortune, People, Southern Living, Money, Sunset, etc. On peut y lire les articles maison et les rechercher par date ou par sujet. Lancé en 1992 en Californie, Wired, premier magazine imprimé entièrement consacré à la culture cyber, est bien évidemment présent sur le web.

Mis en ligne en février 1995, le site web du mensuel Le Monde diplomatique est le premier site d'un périodique imprimé français. Monté dans le cadre d'un projet expérimental avec l'Institut national de l'audiovisuel (INA), ce site est inauguré lors du forum des images Imagina. Il donne accès à l'ensemble des articles depuis janvier 1994, par date, par sujet et par pays. L'intégralité du mensuel en cours est consultable gratuitement pendant deux semaines suivant sa parution. Un forum de discussion permet au journal de discuter avec ses lecteurs. En juin 1998, Philippe Rivière, responsable du site, précise que, trois ans après sa mise en ligne, celui-ci a «bien grandi, autour des mêmes services de base: archives et annonce de sommaire». Grâce à l'internet, «le travail journalistique s'enrichit de sources faciles d'accès, aisément disponibles. Le travail éditorial est facilité par l'échange de courriers électroniques; par contre, une charge de travail supplémentaire due aux messages reçus commence à peser fortement.»

Fin 1995, le quotidien Libération met en ligne son site web, peu après le lancement du Cahier Multimédia, un cahier imprimé hebdomadaire inclus dans l'édition du jeudi. Le site propose la Une du quotidien, la rubrique Multimédia, qui propose les articles du Cahier Multimédia et les archives des cahiers précédents, le Cahier Livres complété par Chapitre Un (les premiers chapitres des nouveautés), et bien d'autres rubriques. La rubrique Multimédia est ensuite rebaptisée Numériques.

Le site du quotidien Le Monde est lancé en 1996. On y trouve des dossiers en ligne, la Une en version graphique à partir de 13 h, l'intégralité du journal avant 17 h, l'actualité en liaison avec l'AFP (Agence France-Presse), et des rubriques sur la bourse, les livres, le multimédia et les sports. En 1998, le journal complet en ligne coûte 5 FF (0,76 euros) alors que l'édition papier coûte 7,50 FF (1,15 euros). S'ils concernent le multimédia, les articles du supplément imprimé hebdomadaire Télévision-Radio-Multimédia sont disponibles gratuitement en ligne dans la rubrique Multimédia, rebaptisée ensuite Nouvelles technologies.

L'Humanité est le premier quotidien français à proposer la version intégrale du journal en accès libre. Classés par rubriques, les articles sont disponibles entre 10 h et 11 h du matin, à l'exception de L'Humanité du samedi, disponible en ligne le lundi suivant. Tous les articles sont archivés sur le site. En juillet 1998, Jacques Coubard, responsable du site web, explique: «Le site de L'Humanité a été lancé en septembre 1996 à l'occasion de la Fête annuelle du journal. Nous y avons ajouté depuis un forum, un site consacré à la récente Coupe du monde de football (avec d'autres partenaires), et des données sur la Fête et sur le meeting d'athlétisme, parrainé par L'Humanité. Nous espérons pouvoir développer ce site à l'occasion du lancement d'une nouvelle formule du quotidien qui devrait intervenir à la fin de l'année ou au début de l'an prochain. Nous espérons également mettre sur le web L'Humanité Hebdo, dans les mêmes délais. Jusqu'à présent on ne peut pas dire que l'arrivée d'internet ait bouleversé la vie des journalistes, faute de moyens et de formation (ce qui va ensemble). Les rubriques sont peu à peu équipées avec des postes dédiés, mais une minorité de journalistes exploitent ce gisement de données. Certains s'en servent pour transmettre leurs articles, leurs reportages. Il y a sans doute encore une "peur" culturelle à plonger dans l'univers du net. Normal, en face de l'inconnu. L'avenir devrait donc permettre par une formation (peu compliquée) de combler ce handicap. On peut rêver à un enrichissement par une sorte d'édition électronique, mais nous sommes sévèrement bridés par le manque de moyens financiers.»

La presse régionale est présente sur le web, par exemple Dernières nouvelles d'Alsace et Ouest-France. Lancé en septembre 1995, le site des Dernières nouvelles d'Alsace propose l'intégrale de l'édition du jour, tout comme des informations pratiques: cours de la bourse, calcul des impôts, etc. Il offre aussi une édition abrégée en allemand. Michel Landaret, responsable du site, précise en juin 1998 que celui-ci «compte actuellement 5.500 lecteurs par jour».

Le quotidien Ouest-France est mis en ligne en juillet 1996. D'abord appelé France-Ouest, le site est ensuite renommé Ouest-France, du nom du journal. En juin 1998, Bernard Boudic, son responsable éditorial, relate: «A l'origine, l'objectif était de présenter et relater les grands événements de l'Ouest en invitant les internautes à une promenade dans un grand nombre de pages consacrées à nos régions (tourisme, industrie, recherche, culture). Très vite, nous nous sommes aperçus que cela ne suffisait pas. Nous nous sommes tournés vers la mise en ligne de dossiers d'actualité, puis d'actualités tout court. Aujourd'hui nous avons quatre niveaux d'infos : quotidien, hebdo (tendant de plus en plus vers un rythme plus rapide), événements et dossiers. Et nous offrons des services (petites annonces, guide des spectacles, presse-école, boutique, etc.). Nous travaillons sur un projet de journal électronique total: mise en ligne automatique chaque nuit de nos quarante éditions (450 pages différentes, 1.500 photos) dans un format respectant typographie et hiérarchie de l'information et autorisant la constitution par chacun de son journal personnalisé (critères géographiques croisés avec des critères thématiques).»

Quelles sont les retombées de l'internet pour les journalistes? «Elles sont encore minces. Nous commençons seulement à offrir un accès internet à chacun (rédaction d'Ouest-France: 370 journalistes répartis dans soixante rédactions, sur douze départements… pas simple). Certains utilisent internet pour la messagerie électronique (courrier interne ou externe, réception de textes de correspondants à l'étranger, envoi de fichiers divers) et comme source d'informations. Mais cette pratique demande encore à s'étendre et à se généraliser. Bien sûr, nous réfléchissons aussi à tout ce qui touche à l'écriture multimédia et à sa rétro-action sur l'écriture imprimée, aux changements d'habitudes de nos lecteurs, etc. (…) Internet est à la fois une menace et une chance. Menace sur l'imprimé, très certainement (captation de la pub et des petites annonces, changement de réflexes des lecteurs, perte du goût de l'imprimé, concurrence d'un média gratuit, que chacun peut utiliser pour diffuser sa propre info, etc.). Mais c'est aussi l'occasion de relever tous ces défis, de rajeunir la presse imprimée.»

Tous sujets que l'on retrouve quelques années plus tard pour les débuts du livre numérique: rapport accru de l'auteur avec ses lecteurs, mise en place de forums de discussion, nécessité d'une formation technique, utilisation de sources très diverses émanant de l'encyclopédie que devient le web, version payante versus version gratuite, version numérique versus version imprimée, etc.

= Divers canaux de diffusion

Contrairement au livre imprimé, vendu dans les librairies, le livre numérique est d'abord vendu par les éditeurs avant d'être vendu par les libraires, pour la raison bien simple qu'il faut laisser le temps à ces derniers de créer une structure qui n'existe pas. Par la suite, l'éditeur peut soit vendre directement sur son propre site ses titres numériques, soit passer un partenariat avec une librairie numérique, soit adopter simultanément les deux formules.

Publiés en mai 1998 par les éditions 00h00, les tout premiers livres numériques commerciaux sont des classiques de la littérature française - Le Tour du monde en 80 jours de Jules Verne, Colomba de Prosper Mérimée, Poil de carotte de Jules Renard, etc. - ainsi que deux inédits : Sur le bout de la langue de Rouja Lazarova et La Coupe est pleine de Pierre Marmiesse. 00h00 passe aussi des accords avec des éditeurs «traditionnels» pour publier en version numérique certains de leurs titres imprimés.

En mars 2000, Michel Valensi, directeur des éditions de l'Eclat, lance le concept du lyber, un terme «construit à partir du mot latin liber qui signifie à la fois: libre, livre, enfant, vin». Dans lePetit traité plié en dix sur le lyber, paru dans Libres enfants du savoir (éditions de l'Eclat, avril 2000), il définit le lyber comme un livre numérique disponible gratuitement sur l'internet dans son intégralité, selon le principe du shareware (partagiciel). Avec invitation d'acheter un exemplaire pour soi ou ses amis, possibilité de signaler l'adresse du libraire le plus proche où trouver le livre, et possibilité de laisser des commentaires sur le texte en ligne. «Le lyber est une tentative de cohabitation dynamique de ces supports. Le principe est simple: diffusion simultanée d'un même contenu sur les deux supports. Livre papier et document-en-ligne.»

A la même date, en mars 2000, Stephen King décide de distribuer sa nouvelle Riding The Bullet uniquement par voie électronique, avec vente dans des librairies en ligne. Suite à cette expérience qui s'avère un succès à la fois médiatique et financier, l'auteur décide de se passer des services de Simon & Schuster, son éditeur habituel. En juillet 2000, il crée un site web spécifique pour débuter la publication en épisodes d'un roman épistolaire, The Plant. Cette deuxième expérience s'avère beaucoup moins concluante que la première, le nombre de téléchargements et de paiements ne cessant de baisser au fil des chapitres. En décembre 2000, après la parution gratuite du sixième chapitre, l'auteur décide de mettre The Plant en hibernation pendant une période indéterminée. Le suivi médiatique de cette expérience pendant les six mois qu'elle aura duré contribue largement à faire connaître le livre numérique, aussi bien chez les professionnels du livre que dans le grand public. D'autres auteurs de best-sellers prennent ensuite le relais, comme Frederick Forsyth au Royaume-Uni et Arturo Pérez-Reverte en Espagne, mais cette fois en partenariat avec leurs éditeurs respectifs.

Durant l'été 2000, Simon & Schuster, l'éditeur habituel de Stephen King, profite de la vague médiatique entourant l'auto-publication d'un de ses auteurs-phare pour se lancer dans l'aventure en créant SimonSays.com. Il décide aussi de publier en version numérique seulement, sans correspondant imprimé, certains titres de Star Trek, la série de science-fiction la plus vendue au monde, qui compte six titres vendus par minute et quarante nouveaux titres publiés par an, en incluant les histoires et récits basés sur les séries télévisées et les films. Le premier titre numérique, The Belly of the Beast de Dean Wesley Smith, est disponible en août 2000 pour 5 dollars US.

D'autres éditeurs emboîtent le pas à Simon & Schuster et débutent la vente de certains titres en version numérique, par exemple le géant Random House et, quelques mois plus tard, St. Martin's Press, puis HarperCollins par le biais de son service électronique PerfectBound.

En octobre 2000, les Presses universitaires de France (PUF) annoncent la parution de quatre titres simultanément en version numérique et en version imprimée. Ces quatre titres ont trait à l'internet: La presse sur internet de Charles de Laubier, La science et son information à l'heure d'internet de Gilbert Varet, Internet et nos fondamentaux par un collectif d'auteurs, et enfin HyperNietzsche publié sous la direction de Paolo d'Iorio. Chose peu courante chez les éditeurs français, le texte intégral d'HyperNietzsche est en accès libre sur le site des PUF pendant deux ans.

En novembre 2000, pour convertir les auteurs qu'il publie à ce nouveau format, Random House annonce que ceux-ci recevront 50% des bénéfices nets réalisés sur la vente de leurs livres numériques, au lieu des 15% habituels. Si ce fort pourcentage était déjà proposé par certains éditeurs électroniques comme le londonien Online Originals, c'est la première fois qu'une maison d'édition traditionnelle de réputation internationale fait un tel effort financier.

En janvier 2001, Barnes & Noble, autre géant du livre, se lance dans l'aventure en créant Barnes & Noble Digital. Barnes & Noble est non seulement une chaîne de librairies traditionnelles doublée d'une librairie en ligne, en partenariat avec Bertelsmann pour cette dernière, mais aussi un éditeur de livres classiques et illustrés. Pour attirer les auteurs, l'éditeur leur propose de leur verser 35% du prix des livres numériques vendus sur son site et les sites affiliés. Un pourcentage moindre que celui offert par Random House, mais nettement supérieur à celui versé par les autres éditeurs en ligne qui, après avoir proposé un pourcentage de 15% à l'origine, proposent un pourcentage d'environ 25% début 2001. L'opération de Barnes & Noble Digital vise bien sûr à convaincre les auteurs de best-sellers de l'intérêt d'une version numérique à côté de la version imprimée.

= Une progression régulière

Comme on le voit, si la vente de livres numériques débute dès mai 1998 avec la commercialisation de quelques titres par les éditions 00h00, elle ne commence vraiment à se généraliser qu'à l'automne 2000. Les titres disponibles sont vendus soit directement par les éditeurs, soit par le biais des libraires, avec impression à la demande grâce aux nouvelles technologies d'impression numérique développées notamment par les sociétés Xerox, Océ et IBM.

Téléchargeables gratuitement, les principaux logiciels de lecture sont les logiciels d'Adobe (Acrobat Reader en juin 1993, Adobe eBook Reader en janvier 2001, Adobe Reader en mai 2003), le Mobipocket Reader (lancé en mars 2000), le Microsoft Reader (lancé en avril 2000) et le Palm Reader (lancé en mars 2001). A l'exception du format PDF (portable document format) apparu dès 1993, les formats utilisés sont basés sur l'OeB (open ebook), devenu en 1999 le format standard des livres numériques.

On voit apparaître les premières librairies numériques, à savoir des librairies vendant exclusivement des livres numériques, le plus souvent par téléchargement, et dans plusieurs formats.

Outre le fait qu'il faille une machine pour le lire - mais, après tout, c'est ce qui le caractérise, en attendant le papier électronique de demain - l'obstacle majeur à la diffusion du livre numérique est le faible nombre de titres disponibles. «Le volume de titres disponibles en format de lecture à l'écran est ridicule par rapport aux quelque 600.000 titres existant en français», indique en février 2001 Denis Zwirn, président de la librairie numérique Numilog. Mais, dès cette date, nombre d'éditeurs numérisent - ou font numériser - leurs fonds, à la perspective d'un marché naissant qui devrait connaître une forte expansion dans les prochaines années. Editeurs en ligne et libraires numériques négocient patiemment les droits auprès des éditeurs traditionnels, et ce non sans mal puisque, à tort ou à raison, la profession reste très inquiète des risques de piratage.

Selon Zina Tucsnak, ingénieur d'études en informatique au Laboratoire ATILF (Analyse et traitement informatique de la langue française), interviewée en novembre 2000, «l'ebook offre une combinaison d'opportunités: la digitalisation et l'internet. Les éditeurs apportent leurs titres à tous les lecteurs du monde. C'est une nouvelle ère de la publication.» Mais, à l'époque, le livre numérique est encore dans l'enfance. Comme l'explique en janvier 2001 Bakayoko Bourahima, documentaliste à l'ENSEA (Ecole nationale supérieure de statistique et d'économie appliquée) d'Abidjan, «il faut voir par la suite comment il se développera et quelles en seront surtout les incidences sur la production, la diffusion et la consommation du livre. A coup sûr cela va entraîner de profonds bouleversements dans l'industrie du livre, dans les métiers liés au livre, dans l'écriture, dans la lecture, etc.»

Une des incidences sur la diffusion du livre est la vente de celui-ci «en pièces détachées», à savoir un chapitre seul, ou une partie de livre, ou un article à l'unité, ou encore une carte ou un tableau statistique. Ce type de vente débute en 2002, à titre expérimental, par exemple chez Numilog ou encore dans la librairie en ligne de l'OCDE (Organisation de coopération et de développement économiques).

Le prix du livre numérique est inférieur d'environ 30% à celui du livre imprimé. Sa commande et sa livraison sont quasi immédiates via l'internet. Quant à sa «taille» et son «poids», ils sont nuls, bien qu'en pareil cas il faille bien sûr prendre en compte la taille et le poids de la machine nécessaire pour le lire. En 2003, un assistant personnel (PDA) de type Pocket PC ou Palm Pilot pesant environ 200 grammes permet d'emporter avec soi une quinzaine de romans de 200 pages. Un ordinateur ultra-portable disposant d'un disque dur de 6 Go (gigaoctets), pesant moins de 1,5 kilo et équipé des logiciels de bureautique standard permet de stocker environ 5.000 livres.

Quelle est la taille d'un fichier de livre numérique, et son temps de téléchargement? En 2003, quelques exemples sont donnés à titre indicatif dans la FAQ de Numilog. Une nouvelle de 50 pages représente un fichier de 150 kilo-octets. Le temps nécessaire à son téléchargement est de 37 secondes avec un modem 56 K (kilobits par seconde) et de 3 à 6 secondes avec une connexion à haut débit (câble ou DSL - digital subscriber line). Un roman de 300 pages représente un fichier de 1 mégaoctet. Son temps de téléchargement est de 4 minutes avec un modem 56 K et de 20 à 40 secondes avec une connexion à haut débit. Un guide pratique de 200 pages incluant des tableaux représente un fichier de 1,5 mégaoctet. Son temps de téléchargement est de 6 minutes avec un modem 56 K et de 30 à 60 secondes avec une connexion à haut débit. Un livre illustré avec des photos représente un fichier de 10 mégaoctets. Son temps de téléchargement est de 41 minutes avec un modem 56 K et de 3 à 6 minutes avec une connexion à haut débit.

Chez les adeptes du livre numérique, l'enthousiasme des années 2000 et 2001 fait place à plus de mesure dans les années qui suivent. On ne parle plus du tout numérique pour le proche avenir, mais plutôt de la publication simultanée d'un même titre en deux versions, imprimée et numérique. Pour mettre en place ce nouveau mode de distribution, la tâche est rude. Il faut constituer les collections, améliorer les logiciels de lecture, rendre le prix des appareils de lecture abordable et, plus difficile encore, habituer le grand public à lire un livre à l'écran.

Alors que, en octobre 2000, l'eBook est l'une des vedettes de la Foire internationale du livre de Francfort, il se fait beaucoup plus modeste les années suivantes. La même remarque vaut pour le Salon du livre de Paris qui, après avoir proposé un Village eBook en mars 2000, puis le premier sommet européen de l'édition numérique - dénommé eBook Europe 2001 - l'année suivante, n'organise pas de grande manifestation spécifique en 2002 et 2003. Il faut attendre le Salon de 2006 pour observer à nouveau un réel engouement, avec une vaste «plateforme numérique» rassemblant des imprimeurs numériques, des sociétés de numérisation d'ouvrages et des fabricants de livres numériques.

Cependant, malgré le pessimisme relatif ayant succédé aux déclarations enthousiastes, le livre numérique poursuit patiemment son chemin. Si sa progression est lente, elle est constante. En 2001, le grand éditeur Random House vend deux fois plus de livres numériques qu'en 2000. Tous éditeurs confondus, les ventes de 2001 se chiffrent par milliers pour le New World College Dictionary de Webster, les ouvrages de fiction de Stephen King et de Lisa Scottolini, les livres d'économie et les manuels pratiques. Palm Digital Media, grande librairie numérique pour assistant personnel (PDA), vend 180.000 livres en 2001, une augmentation de 40% par rapport à l'année précédente. Début 2002, PerfectBound, le service électronique de l'éditeur HarperCollins, propose 10% du catalogue imprimé sous forme numérique. A la même date, Random House décide de publier systématiquement une version imprimée et une version numérique pour ses nouveaux titres.

Conséquence d'un marché en pleine expansion, après avoir été conçus pour une machine spécifique - soit un ordinateur soit un assistant personnel - les principaux logiciels de lecture deviennent polyvalents. Si l'Acrobat Reader est d'abord uniquement disponible sur ordinateur les premières années, Adobe lance un Acrobat Reader pour assistant personnel en 2001, d'abord pour le Palm Pilot (mai 2001), puis pour Pocket PC (décembre 2001). Si, à l'origine, le Mobipocket Reader est destiné à la lecture sur assistant personnel, Mobipocket lance une version pour ordinateur en avril 2002. La même remarque vaut pour le Palm Reader. D'abord destiné au Palm Pilot et au Pocket PC, il s'étend à l'ordinateur en juillet 2002.

Chose peu courante chez les concepteurs de logiciels, Mobipocket propose d'emblée un logiciel de lecture «universel», utilisable sur tout assistant personnel puis sur ordinateur, et manifeste très tôt un réel souci d'ouverture aux autres formats. Le Mobipocket Publisher permet de créer des livres numériques non seulement au format PRC (lisible sur le Mobipocket Reader) mais aussi au format LIT (lisible sur le Microsoft Reader).

Après avoir fait cavalier seul en promouvant leur propre logiciel de lecture, les constructeurs y mettent aussi du leur. L'assistant personnel Palm Pilot permet de lire des livres numériques aussi bien sur le Palm Reader que sur le Mobipocket Reader. Son principal concurrent, le Pocket PC de Microsoft, permet de lire des livres sur le Microsoft Reader, le Mobipocket Reader et le Palm Reader.

Vétéran des logiciels de lecture avec dix ans d'existence en 2003, l'Acrobat Reader (devenu l'Adobe Reader en mai 2003) s'adapte régulièrement aux besoins du marché. Pour ne prendre qu'un exemple, les utilisateurs d'autres logiciels disent apprécier le reflowing, une technique leur permettant de reformater automatiquement un livre et sa pagination en fonction de la taille de l'écran. Le reflowing est autorisé par les formats basés sur l'OeB (open ebook). Alors que ceci était impossible avec les versions précédentes de l'Acrobat Reader, le format PDF n'étant pas basé sur l'OeB, les versions 5 et suivantes d'Adobe Acrobat permettent de créer des documents PDF autorisant le reflowing, même si la numérotation des pages du document initial reste figée. Quatre ans après, en 2007, il est possible de créer des PDF compatibles avec l'OeB.

Le nombre de titres s'accroît rapidement au fil des ans. En septembre 2003, le catalogue de Numilog comprend 3 500 titres (livres et numéros de revues) en français et en anglais, grâce à un partenariat avec une quarantaine d'éditeurs. En décembre 2006, ce catalogue comprend 35.000 titres grâce à un partenariat avec 200 éditeurs, dont 60 éditeurs francophones. La progression est tout aussi rapide pour Mobipocket. En 2003, le catalogue comprend 6.000 titres en plusieurs langues. En avril 2007, le catalogue comprend 39.000 titres en vente et 10.000 titres gratuits, et il est désormais diffusé par Amazon, qui a racheté la société en avril 2005.

9.3. Chronologie

* Cette chronologie ne prétend pas à l'exhaustivité.

1993 (juin): Acrobat Reader, premier logiciel de lecture, lancé par Adobe.

1996 (mars): Palm Pilot, premier assistant personnel du marché.

1996 (mai): Fondation du DAISY Consortium pour définir un standard de livre audionumérique.

1998 (mai): Premiers livres commerciaux lancés par les éditions 00h00.

1999 (septembre): Open eBook (OeB), standard de livre numérique.

2000 (janvier): Fondation de l'Open eBook Forum (OeBF).

2000 (janvier): Partenariat entre Microsoft et Barnes & Noble.com pour la vente de livres numériques.

2000 (mars): Mobipocket Reader, logiciel de lecture de Mobipocket.

2000 (mars): Concept du lyber par Michel Valensi.

2000 (mars): Riding the Bullet, nouvelle de Stephen King, distribuée sur l'internet.

2000 (avril): Pocket PC, assistant personnel de Microsoft.

2000 (avril): Microsoft Reader, logiciel de lecture utilisable sur Pocket PC.

2000 (juillet): Autopublication sur le web de The Plant, roman de Stephen King.

2000 (août): Partenariat entre Microsoft et Amazon pour la vente de livres numériques.

2000 (août): Microsoft Reader disponible pour toute plateforme Windows.

2000 (août): eBooks Store de Barnes & Noble.com.

2000 (été): SimonSays.com, branche numérique de Simon & Schuster.

2000 (octobre): Premiers titres numériques des PUF (Presses universitaires de France).

2000 (novembre): Conditions attractives pour la publication en numérique des auteurs de Random House.

2000 (décembre): eBooks Store d'Amazon.

2000 (décembre): Arrêt de l'autopublication sur le web de The Plant, roman de Stephen King.

2001: Premiers systèmes de DRM pour la gestion des droits numériques.

2001 (janvier): Adobe eBook Reader, logiciel de lecture pour livres sous droits.

2001 (janvier): Adobe Content Server, logiciel de gestion des droits numériques.

2001 (janvier): Barnes & Noble Digital, branche numérique de Barnes & Noble.

2001 (mars): Rachat de Peanutpress et de son logiciel de lecture par Palm.

2001 (mars): Palm Reader, logiciel de lecture de Palm.

2001 (avril): Partenariat entre Adobe et Amazon pour la vente de livres numériques.

2001 (mai): Acrobat Reader disponible pour Palm Pilot.

2001 (décembre): Acrobat Reader disponible pour Pocket PC.

2002 (avril): Mobipocket Reader disponible pour ordinateur personnel.

2002 (juillet): Palm Reader disponible pour ordinateur personnel.

2002 (novembre): Microsoft Reader disponible pour tablette PC.

2003 (mai): L'Adobe Reader remplace l'Acrobat Reader et l'Adobe eBook Reader.

2004 (novembre): L'Adobe LiveCycle Policy Server remplace l'Adobe Content Server.

2005 (avril): L'IDPF (International Digital Publishing Forum) succède à l'OeBF (Open eBook Forum).

2005 (avril): Rachat de Mobipocket par Amazon.

10. LES SUPPORTS DE LECTURE

[10.1. Tablettes de lecture / Premiers modèles / Gemstar eBook / Cybook (Cytale - Bookeen) / Autres tablettes récentes // 10.2. Assistants personnels (PDA) / Psion / eBookMan (Franklin) / Palm Pilot et Pocket PC // 10.3. Nouveaux appareils / Souhaits en l'an 2000 / @folio, baladeur de textes / Smartphones et successeurs // 10.4. Le papier électronique / Souhaits en l'an 2000 / E Ink / Autres initiatives // 10.5. Chronologie]

Les livres numériques sont d'abord lisibles sur l'écran de l'ordinateur. En 1999, pour plus de mobilité, on voit apparaître des appareils dédiés, sous forme de tablettes électroniques. A partir de l'an 2000, les assistants personnels (PDA) intègrent peu à peu des logiciels de lecture. Suit la lecture sur webpad et tablette PC, puis sur téléphone portable et smartphone. Annoncé pour la fin des années 2000, le papier électronique devrait permettre de concilier les avantages du numérique et le confort d'un matériau souple proche du papier.

10.1. Tablettes de lecture

Une tablette électronique de lecture se présente comme une machine portable de la taille d'un gros livre, avec un écran à cristaux liquides (appelé aussi écran LCD: liquid crystal display) rétro-éclairé ou non, noir et blanc ou en couleur. Elle fonctionne sur batterie et, selon les modèles, dispose d'un modem intégré, d'un port USB et de connexions Bluetooth et WiFi, pour connexion à l'internet et téléchargement des livres à partir de sites d'éditeurs ou de librairies numériques.

= Premiers modèles

Apparues en 1999, les premières tablettes de lecture sont conçues et développées dans la Silicon Valley, en Californie. Le modèle le plus connu, le Rocket eBook, est créé par la société NuvoMedia, en partenariat avec la chaîne de librairies Barnes & Noble et le géant des médias Bertelsmann. Un deuxième modèle, le Softbook Reader, est développé par la société Softbook Press, en partenariat avec les deux grandes maisons d'édition Random House et Simon & Schuster. Plusieurs autres modèles ont une durée de vie assez courte, par exemple l'Everybook, appareil à double écran créé par la société du même nom, ou encore le Millennium eBook, créé par Librius.com. A cette époque, qui n'est pas si lointaine, toutes ces tablettes électroniques pèsent entre 700 grammes et 2 kilos et peuvent stocker une dizaine de livres.

= Gemstar eBook

Lancés en octobre 2000 à New York, les deux premiers modèles de Gemstar eBook sont les successeurs du Rocket eBook (conçu par la société NuvoMedia) et du Softbook Reader (conçu par la société Softbook Press), suite au rachat de NuvoMedia et de Softbook Press par Gemstar-TV Guide International en janvier 2000. Commercialisés en novembre 2000 aux Etats-Unis, ces deux modèles - le REB 1100 (écran noir et blanc, successeur du Rocket eBook) et le REB 1200 (écran couleur, successeur du Softbook Reader) - sont construits et vendus sous le label RCA, appartenant à Thomson Multimedia. Le système d'exploitation, le navigateur et le logiciel de lecture sont spécifiques au produit, tout comme le format de lecture, basé sur le format OeB (open ebook).

Le REB 1100 (18 x 13,5 centimètres) a une taille comparable à celle d'un (très) gros livre broché. Son poids est de 510 grammes. Son autonomie est de 15 heures. Il dispose d'un modem 36,6 K (kilobits par seconde). Sa mémoire compact flash de 8 mégaoctets permet de stocker 20 romans, soit 8.000 pages de texte. La mémoire peut être étendue à 72 mégaoctets pour permettre un stockage de 150 livres, soit 60.000 pages de texte. L'écran tactile noir et blanc rétro-éclairé a une résolution de 320 x 480 pixels. Le REB 1100 est vendu par la chaîne de magasins SkyMall au prix de 300 dollars US.

Un peu plus volumineux, le REB 1200 (23 x 19 centimètres) a la taille d'un grand livre cartonné. Son poids est de 750 grammes. Son autonomie est de 6 à 12 heures. Il dispose d'un modem 56 K et d'une connexion Ethernet. Sa mémoire compact flash de 8 mégaoctets permet de stocker 5.000 pages. La mémoire peut être étendue à 128 mégaoctets pour permettre un stockage de 80.000 pages. L'écran tactile couleur rétro-éclairé a une résolution de 480 x 640 pixels. Le REB 1200 est vendu par SkyMall au prix de 699 dollars.

La commercialisation du modèle européen, le GEB 2200, débute en octobre 2001 en commençant par l'Allemagne. Le GEB 2200 a les mêmes caractéristiques que le REB 1200. Son poids est un peu supérieur (970 grammes) parce qu'il inclut une couverture en cuir protégeant l'écran. Son prix est de 649 euros. Ce prix inclut deux abonnements - un abonnement de six semaines à la version électronique de Der Spiegel et un abonnement de quatre semaines à la version électronique du Financial Times Deutschland - ainsi que deux best-sellers et quinze oeuvres classiques.

Aux Etats-Unis, les ventes sont très inférieures aux pronostics. En avril 2002, un article du New York Times annonce l'arrêt de la fabrication de ces appareils par RCA. A l'automne 2002, leurs successeurs, le GEB 1150 et le GEB 2150, sont produits sous le label Gemstar et vendus par SkyMall à un prix beaucoup plus compétitif, avec ou sans abonnement annuel ou bisannuel à la librairie numérique de Gemstar eBook. Le GEB 1150 coûte 199 dollars sans abonnement, et 99 dollars avec abonnement annuel (facturé 20 dollars par mois). Le GEB 2150 coûte 349 dollars sans abonnement, et 199 dollars avec abonnement bisannuel (20 dollars par mois). Les deux modèles GEB 1150 et GEB 2150 sont livrés non seulement avec un dictionnaire intégré, le Webster's Pocket American Dictionary (publié par Random House), mais aussi avec la version anglaise du Tour du monde en 80 jours de Jules Verne (publiée par eBooks Classics), best-seller universel qui poursuit ainsi sa carrière en version numérique. En Allemagne, on parle d'un remplacement éventuel du GEB 2200 par le GEB 1150 courant 2003. Mais Gemstar décide de mettre fin à ses activités eBook. La société cesse la vente de ses tablettes de lecture en juin 2003 et celle de ses livres numériques le mois suivant.

= Cybook (Cytale / Bookeen)

Première tablette de lecture européenne, le Cybook (21 x 16 centimètres) est conçu et développé par la société française Cytale, et commercialisé en janvier 2001. Son poids est de 1 kilo. Sa mémoire - 32 Mo (mégaoctets) de mémoire SDRAM (synchronous dynamic random access memory) et 16 Mo de mémoire flash - permet de stocker 15.000 pages de texte, soit 30 livres de 500 pages. Son autonomie est de 5 heures. Il est équipé d'un modem 56 K, d'un haut-parleur, d'une sortie stéréo avec prise casque et de plusieurs ports pour périphériques. L'écran tactile couleur rétro-éclairé a une résolution de 600 x 800 pixels. L'affichage est possible en mode portrait ou paysage. Le Cybook utilise le système d'exploitation Windows CE de Microsoft, le navigateur Internet Explorer et un logiciel de lecture spécifique basé sur le format OeB. Il intègre un dictionnaire Hachette de 35.000 mots. En mars 2002, il coûte 883 euros sans abonnement, et 456 euros avec abonnement annuel (facturé 20 euros par mois). Les livres sont téléchargés à partir du site web de Cytale, suite à des partenariats avec plusieurs éditeurs et sociétés de presse.

«J'ai croisé il y a deux ans le chemin balbutiant d'un projet extraordinaire, le livre électronique, écrit en décembre 2000 Olivier Pujol, PDG de Cytale. Depuis ce jour, je suis devenu le promoteur impénitent de ce nouveau mode d'accès à l'écrit, à la lecture, et au bonheur de lire. La lecture numérique se développe enfin, grâce à cet objet merveilleux: bibliothèque, librairie nomade, livre "adaptable", et aussi moyen d'accès à tous les sites littéraires (ou non), et à toutes les nouvelles formes de la littérature, car c'est également une fenêtre sur le web.»

Cytale développe aussi le Cybook Pro, une version du Cybook à destination des entreprises, des universités et des collectivités pour la gestion de leurs documents numérisés: dossiers clients, normes techniques, procédures, catalogues, cartes, etc.

Par ailleurs, en collaboration avec l'INSERM (Institut national de la santé et de la recherche médicale), Cytale adapte son logiciel pour permettre la lecture de livres numériques sur plage braille ou sur synthèse vocale. Dans cette optique, la société développe le Cybook Vision, une tablette adaptée aux besoins des personnes malvoyantes et distribuée par un réseau d'opticiens. «Toutes les opérations de navigation, en mode autonome, ont été élaborées sur les conseils d'orthoptistes et à partir des suggestions de malvoyants, lit-on sur le site web. Réduites à l'essentiel, elles autorisent la création de stratégies de lecture personnalisées. L'appareil, qui fonctionne comme un enregistreur, est doté d'une capacité de mémoire qui autorise une contenance d'environ trente livres. Chaque ouvrage est lisible dans deux polices et six tailles de caractères. La catégorie la plus grande correspond à un corps de texte 28 ou à la taille P. 20 selon les normes des orthoptistes. La résolution d'écran "Super VGA" (super video graphics adapter) de 100 DPI (dots per inch) offre une excellente netteté des caractères. Le rétro-éclairage de cet écran autorise la lecture dans une ambiance peu lumineuse. Le contraste et la luminosité peuvent être réglés séparément et sont activés par un bouton. Une icône autorise le changement de couleur de fond, qui passe du blanc au jaune pour répondre à certains problèmes de photosensibilité. Les textes peuvent être lus en corps noir sur blanc ou blanc sur noir, jaune sur noir ou noir sur jaune.»

Pour les trois modèles, les ventes sont très inférieures aux pronostics. Ces ventes insuffisantes forcent la société à se déclarer en cessation de paiement, l'administrateur ne parvenant pas à trouver un repreneur après le redressement judiciaire prononcé en avril 2002. Cytale est mis en liquidation judiciaire en juillet 2002 et cesse ses activités à la même date.

La commercialisation du Cybook est reprise quelques mois plus tard par la société Bookeen, créée en 2003 à l'initiative de Michael Dahan et de Laurent Picard, deux ex-ingénieurs de chez Cytale. «A côté des logiciels "maison" - le Boo Reader et le Boo Reader Vision - le Mobipocket Reader, le µBook et le PDF Viewer équipent désormais par défaut la tablette», explique Alain Patez, responsable des éditions numériques à la Médiathèque Landowski de Boulogne-Billancourt, et qui met ces tablettes à la disposition de son public. «Le Cybook s'enrichit d'une nouvelle suite logicielle et d'un nouveau mode de connexion et de synchronisation, grâce au support de l'infrarouge et de l'USB. Cette nouvelle version est mise en vente en juin 2004. Grâce à son partenariat avec Mobipocket, Bookeen ouvre en novembre 2004 sa propre librairie en ligne (Ubibooks). Les livres sont également proposés sur carte amovible, la "BibliCarte", au format OeB. Commercialisée principalement aux Etats-Unis, la tablette est en rupture de stock en octobre 2006. En juillet 2007, Bookeen dévoile la nouvelle version e-ink / e-paper de sa tablette baptisée "Cybook Gen3". Cette machine opère désormais sous plateforme Linux et dispose d'une suite logicielle comparable à la version antérieure. Elle se distingue particulièrement par son poids - 174 grammes - et par une autonomie de lecture d'un mois sans rechargement. L'écran, monochrome, affiche quatre nuances de gris. La commercialisation du Cybook Gen3 est annoncée pour septembre 2007. Cette tablette exploitera la technologie d'encre électronique E Ink.»

= Autres tablettes récentes

En avril 2004, Sony lance au Japon le Librié 1000-EP, produit en partenariat avec les sociétés Philips et E Ink. Cette nouvelle tablette est la première à utiliser la technologie d'affichage développée par la société E Ink et communément appelée encre électronique. L'appareil pèse 300 grammes (avec piles et protection d'écran), pour une taille de 12,6 x 19 x 1,3 centimètres. Sa mémoire est de 10 mégaoctets - avec possibilité d'extension - et sa capacité de stockage de 500 livres. Son écran de 6 pouces a une définition de 170 DPI et une résolution de 800 x 600 pixels. Un port USB permet le téléchargement des livres à partir de l'ordinateur. L'appareil comprend aussi un clavier, une fonction enregistrement et une synthèse vocale. Il fonctionne avec quatre piles alcalines, qui permettraient la consultation de 10.000 pages. Son prix est de 375 dollars US.

D'autres modèles sont lancés par divers constructeurs, par exemple Toshiba, qui lance le Ebook, Panasonic, qui lance le Sigma Book, ou eREAD, qui lance le STAReBook (appelé aussi e-Reader par le quotidien Les Echos).

Les trois modèles les plus présents en 2007 semblent être l'iLiad (iRex Technologies), le Sony Reader (Sony) et le Hanlin eReader (Jinke), qui utilisent tous les trois la technologie E Ink. Lancé par la société néerlandaise iRex Technologies, l'iLiad est conçu spécifiquement pour la consultation de journaux électroniques et pour la lecture de livres sur le Mobipocket Reader. Produit par la société chinoise Jinke, le Hanlin eReader se décline en plusieurs versions et supporte de nombreux formats, dont les formats PDF, DOC, HTML, MP3, JPG, TXT et ZIP. Lancé en octobre 2006 aux Etats-Unis, le Sony Reader, plus petit que l'iLiad, est vendu au prix de 350 dollars US.

En mai 2007, Telecom Italia lance le Librofonino, décrit comme un « livre cellulaire ». Connectable en permanence aux réseaux téléphoniques sans fil (3GSM et autres) quel que soit le pays, le Librofonino tient aisément dans une poche, avec un écran ouvrant plus large que l'appareil lui-même. Suite à l'acquisition de Mobipocket en avril 2005, Amazon lance fin 2007 sa propre tablette de lecture, le Kindle. Reste à voir si ces modèles auront une durée de vie supérieure à celle de leurs prédécesseurs. En 2008, on attend un écran souple ultrafin appelé papier électronique.

Parallèlement, quelques quotidiens tentent une expérience de lecture nomade. En avril 2006, le quotidien belge De Tidj est proposé en version électronique nomade sur l'iLiad. En avril 2007, le quotidien français Les Echos lance une version électronique nomade - actualisée plusieurs fois par jour - sur deux tablettes de lecture, avec un prix différent selon la tablette achetée: 649 euros (abonnement annuel + achat de l'e-Reader d'e-READ) ou 769 euros (abonnement annuel + achat de l'iLiad). Pour ceux qui auraient déjà leur tablette, l'abonnement annuel sans tablette est de 365 euros.

10.2. Assistants personnels (PDA)

Lorsque le livre numérique commence à se généraliser en 2000, les fabricants d'assistants personnels (PDA) décident d'intégrer un logiciel de lecture dans leur machine, en plus des fonctionnalités habituelles : agenda, dictaphone, lecteur de MP3, etc. En parallèle, à partir de la production imprimée existante, ils négocient les droits de diffusion numérique de centaines de titres. Si certains professionnels du livre s'inquiètent de la petitesse de l'écran, les adeptes de la lecture sur PDA assurent que la taille de l'écran n'est pas un problème.

= Psion

Marie-Joseph Pierre est enseignante-chercheuse à l'Ecole pratique des hautes études (EPHE, section Sciences religieuses, Paris-Sorbonne). Elle utilise un Psion depuis plusieurs années pour lire et étudier dans le train lors de ses fréquents déplacements entre Argentan, sa ville de résidence, et Paris. Elle achète son premier Psion en 1997, un Série 3, remplacé ensuite par un Série 5, remplacé lui-même par un Psion 5mx en juin 2001. En février 2002, elle raconte: «J'ai chargé tout un tas de trucs littéraires - dont mes propres travaux et dont la Bible entière - sur mon Psion 5mx (16 + 16 mégaoctets), que je consulte surtout dans le train ou pour mes cours, quand je ne peux pas emporter toute une bibliothèque. J'ai mis les éléments de programme qui permettent de lire page par page comme sur un véritable ebook. Ce qui est pratique, c'est de pouvoir charger une énorme masse documentaire sur un support minuscule. Mais ce n'est pas le même usage qu'un livre, surtout un livre de poche qu'on peut feuilleter, tordre, sentir…, et qui s'ouvre automatiquement à la page qu'on a aimée. C'est beaucoup moins agréable à utiliser, d'autant que sur PDA, la page est petite: on n'a pas de vue d'ensemble. Mais une qualité appréciable: on peut travailler sur le texte enregistré, en rechercher le vocabulaire, réutiliser des citations, faire tout ce que permet le traitement informatique du document, et cela m'a pas mal servi pour mon travail, ou pour mes activités associatives. Je fais par exemple partie d'une petite société poétique locale, et nous faisons prochainement un récital poétique. J'ai voulu rechercher des textes de Victor Hugo, que j'ai maintenant pu lire et même charger à partir du site de la Bibliothèque nationale de France: c'est vraiment extra.»

Le Psion Organiser est le vétéran des agendas électroniques. Le premier modèle est lancé dès 1984 par la société britannique Psion. Au fil des ans, la gamme des appareils s'étend et la société se développe à l'international. En 2000, les divers modèles (Série 7, Série 5mx, Revo, Revo Plus) sont concurrencés par le Palm Pilot et le Pocket PC. Suite à une baisse des ventes, la société décide de diversifier ses activités. Suite au rachat de Teklogix, Psion Teklogix est fondé en septembre 2000 afin de développer des systèmes informatiques mobiles sans fil à destination des entreprises. Psion Software est fondé en 2001 pour développer les logiciels de la nouvelle génération d'appareils mobiles utilisant la plateforme Symbian OS, par exemple ceux du smartphone Nokia 9210, modèle précurseur commercialisé la même année.

= eBookMan (Franklin)

Basée dans le New Jersey (Etats-Unis), la société Franklin commercialise dès 1986 le premier dictionnaire consultable sur une machine de poche. Quinze ans plus tard, Franklin distribue 200 ouvrages de référence sur des machines de poche: dictionnaires unilingues et bilingues, encyclopédies, bibles, manuels d'enseignement, ouvrages médicaux et livres de loisirs.

En octobre 2000, Franklin lance l'eBookMan, un assistant personnel multimédia qui, entre autres fonctionnalités (agenda, dictaphone, etc.), permet la lecture de livres numériques sur le logiciel de lecture Franklin Reader. A la même date, l'eBookMan reçoit l'eBook Technology Award de la Foire internationale du livre de Francfort. Trois modèles (EBM-900, EBM-901 et EBM-911) sont disponibles début 2001. Leurs prix respectifs sont de 130, 180 et 230 dollars US. Le prix est fonction de la taille de la mémoire vive (8 ou 16 mégaoctets) et de la qualité de l'écran à cristaux liquides (écran LCD), rétro-éclairé ou non selon les modèles. Nettement plus grand que celui de ses concurrents, l'écran n'existe toutefois qu'en noir et blanc, contrairement à la gamme Pocket PC ou à certains modèles Palm avec écran couleur. L'eBookMan permet l'écoute de livres audio et de fichiers musicaux au format MP3.

En octobre 2001, Franklin décide de ne pas intégrer le Microsoft Reader à l'eBookMan, mais de lui préférer le Mobipocket Reader, logiciel de lecture jugé plus performant, et primé à la même date par l'eBook Technology Award à Francfort. Parallèlement, le Franklin Reader est progressivement disponible pour les gammes Psion, Palm, Pocket PC et Nokia. Franklin développe aussi une librairie numérique sur son site en passant des partenariats avec plusieurs éditeurs, notamment avec Audible.com pour avoir accès à sa collection de 4.500 livres audionumériques.

= Palm Pilot et Pocket PC

Suite au Psion et à l'eBookMan, les usagers se tournent peu à peu vers deux nouvelles gammes d'assistants personnels (ou PDA: personal digital assistant), les Palm Pilot et les Pocket PC, qui deviennent les favoris du marché.

La société Palm lance le premier Palm Pilot en mars 1996 et vend 23 millions de machines entre 1996 et 2002. Son système d'exploitation est le Palm OS et son logiciel de lecture le Palm Reader. En mars 2001, les modèles Palm permettent aussi la lecture de livres numériques sur le Mobipocket Reader.

Commercialisé par Microsoft en avril 2000 pour concurrencer le Palm Pilot, le Pocket PC utilise un système d'exploitation spécifique, Windows CE, qui intègre le nouveau logiciel de lecture Microsoft Reader. En octobre 2001, Windows CE est remplacé par Pocket PC 2002, qui permet entre autres de lire des livres numériques sous droits. Ces livres sont protégés par un système de gestion des droits numériques dénommé Microsoft DAS Server (DAS: digital asset server). En 2002, le Pocket PC permet la lecture sur trois logiciels: le Microsoft Reader bien sûr, le Mobipocket Reader et le Palm Reader.

D'après Seybold Reports.com, en avril 2001, on compte 100.000 tablettes de lecture pour 17 millions d'assistants personnels (PDA). Deux ans plus tard, en juin 2003, plus aucune tablette n'est commercialisée. De nouveaux modèles apparaissent ensuite, mais on se demande s'ils peuvent vraiment réussir à s'imposer face à l'assistant personnel, qui offre aussi d'autres fonctionnalités. On se demande aussi s'il existe une clientèle spécifique pour les deux machines, la lecture sur assistant personnel étant destinée au grand public, et la lecture sur tablette électronique étant réservée aux gros consommateurs de documents que sont les lycéens, les étudiants, les professeurs, les chercheurs ou les juristes. Le débat reste toujours d'actualité dans les années qui suivent.

10.3. Nouveaux appareils

= Souhaits en l'an 2000

En l'an 2000, à l'exception de quelques spécialistes, les professionnels du livre restent assez sceptiques sur le confort de lecture procuré par une machine. Si le concept les séduit, les premiers modèles ne suscitent guère d'enthousiasme, sinon une curiosité amusée et le souhait de meilleurs appareils de lecture. «Je pense qu'on est loin des formats et des techniques définitifs, déclare en novembre 2000 Nicolas Pewny, fondateur des éditions du Choucas. Beaucoup de recherches sont en cours, et un format et un support idéal verront certainement le jour sous peu.»

Anne-Bénédicte Joly, écrivain auto-éditeur, écrit à la même date: «Le livre électronique est avant tout un moyen pratique d'atteindre différemment une certaine catégorie de lecteurs composée pour partie de curieux aventuriers des techniques modernes et pour partie de victimes du mode résolument technologique. (…) Je suis assez dubitative sur le "plaisir" que l'on peut retirer d'une lecture sur un écran d'un roman de Proust. Découvrir la vie des personnages à coups de souris à molette ou de descente d'ascenseur ne me tente guère. Ce support, s'il possède à l'évidence comme avantage la disponibilité de toute oeuvre à tout moment, possède néanmoins des inconvénients encore trop importants. Ceci étant, sans nous cantonner à une position durablement ancrée dans un mode passéiste, laissons à ce support le temps nécessaire pour acquérir ses lettres de noblesse.»

Cet avis est partagé par Jacky Minier, créateur de Diamedit, site de promotion d'inédits artistiques et littéraires. «L'ebook est sans aucun doute un support extraordinaire, explique-t-il en octobre 2000. Il aura son rôle à jouer dans la diffusion des oeuvres ou des journaux électroniques, mais il ne remplacera jamais le véritable bouquin papier de papa. Il le complétera. (…) Voyez la monnaie électronique: on ne paie pas encore son boulanger ou ses cigarettes avec sa carte de crédit et on a toujours besoin d'un peu de monnaie dans sa poche, en plus de sa carte Visa. L'achat d'un livre n'est pas un acte purement intellectuel, c'est aussi un acte de sensualité que ne comblera jamais un ebook. Naturellement, l'édition classique devra en tenir compte sur le plan marketing pour se différencier davantage, mais je crois que l'utilisation des deux types de supports sera bien distincte. Le téléphone n'a pas tué le courrier, la radio n'a pas tué la presse, la télévision n'a pas tué la radio ni le cinéma… Il y a de la place pour tout, simplement, ça oblige à chaque fois à une adaptation et à un regain de créativité. Et c'est tant mieux!»

Jean-Pierre Balpe, directeur du département hypermédias de l'Université Paris 8, écrit pour sa part en janvier 2001: «J'attends de voir concrètement comment ils fonctionnent et si les éditeurs sont capables de proposer des produits spécifiques à ce support car, si c'est pour reproduire uniquement des livres imprimés, je suis assez sceptique. L'histoire des techniques montre qu'une technique n'est adoptée que si - et seulement si… - elle apporte des avantages concrets et conséquents par rapport aux techniques auxquelles elle prétend se substituer.»

Ce scepticisme est partagé par Olivier Bogros, directeur de la Médiathèque municipale de Lisieux (Normandie), qui s'exclame en août 2000: «De quoi parle-t-on? Des machines monotâches encombrantes et coûteuses, avec format propriétaire et offre éditoriale limitée? Les Palm, Psion et autres hand et pocket computers permettent déjà de lire ou de créer des livres électroniques (appelés ici livres numériques, ndlr), et en plus servent à autre chose. Ceci dit, la notion de livre électronique m'intéresse en tant que bibliothécaire et lecteur. Va-t-il permettre de s'affranchir d'un modèle économique à bout de souffle (la chaîne éditoriale n'est pas le must en la matière)? Les machines à lire n'ont de mon point de vue de chance d'être viables que si leur utilisateur peut créer ses propres livres électroniques avec (cf. cassettes vidéo).»

Patrick Rebollar, professeur de littérature française et d'informatique dans des universités japonaises, écrit en décembre 2000: «Je trouve enthousiasmant le principe de stockage et d'affichage mais j'ai des craintes quant à la commercialisation des textes sous des formats payants. Les chercheurs pourront-ils y mettre leurs propres corpus et les retravailler? L'outil sera-t-il vraiment souple et léger, ou faut-il attendre le développement de l'encre électronique? Je crois également que l'on prépare un cartable électronique pour les élèves des écoles, ce qui pourrait être bon pour leur dos…»

Olivier Gainon, fondateur des éditions CyLibris, manifeste lui aussi un certain scepticisme à l'égard des modèles actuels. Il explique à la même date: «Je ne crois pas trop à un objet qui a des inconvénients clairs par rapport à un livre papier (prix / fragilité / aspect / confort visuel / etc.), et des avantages qui me semblent minimes (taille des caractères évolutifs / plusieurs livres dans un même appareil / rétro-éclairage de l'écran / etc.). De même, je vois mal le positionnement d'un appareil exclusivement dédié à la lecture, alors que nous avons les ordinateurs portables d'un côté, les téléphones mobiles de l'autre et les assistants personnels (dont les Pocket PC) sur le troisième front. Bref, autant je crois qu'à terme la lecture sur écran sera généralisée, autant je ne suis pas certain que cela se fera par l'intermédiaire de ces objets.»

Chargement de la publicité...