Gallica
Pour les articles homonymes, voir Gallica (homonymie).
|
|
Adresse | https://gallica.bnf.fr/ |
---|---|
Slogan | Source de culture et d'émotions |
Commercial | non |
Type de site | Bibliothèque numérique |
Langue | Français, anglais, allemand, italien, russe |
Siège social |
Paris, Île-de-France France |
Propriétaire | Bibliothèque nationale de France |
Lancement | 1997 |
modifier | |
Gallica est la bibliothèque numérique de la Bibliothèque nationale de France et de ses partenaires. En libre accès depuis 1997, elle regroupe plusieurs millions de documents (des livres au format Epub, des journaux, des revues, des images, des enregistrements sonores, des cartes, des manuscrits et des vidéos).
Gallica franchit le cap du millionième document en 2010, des six millions en 2020[1], des huit millions en [2] et des 9 millions en octobre 2022.
Caractéristiques
Collections
En août 2017, Gallica proposait à la consultation en ligne 4 252 443 documents, avec un rythme de 1 500 pages numérisées par jour[3] et 7 912 415 documents au , dont 786 597 livres, 4 717 966 fascicules de presse et revues, 1 474 042 images, 182 312 manuscrits, 174 848 cartes, 54 470 partitions, 51 535 enregistrements sonores, 499 761 objets et 2 258 vidéos. Un certain nombre d'ouvrages a fait l'objet d'une reconnaissance optique de caractères et le texte peut être recherché sur Gallica.
L'ensemble des collections stockées sur Gallica et Gallica intra-muros représentait un volume de 1 519 téraoctets au [4], ce qui équivaut à plus de 3 millions de documents[5]. Elle continue de s'enrichir régulièrement de milliers de documents[5][évasif].
Notice
À chaque document est associé un identifiant numérique destiné à sa conservation sur le long terme, nommé Archival Resource Key (ARK).
Tous les documents disposent également d'une notice propre, qui peut contenir :
- titre : le titre de l'œuvre ;
- éditeur ;
- date d'édition : exemple : (1789-1792) ;
- sujet : des mots et expressions clés servant à faire des recherches ;
- type : exemple : image fixe, estampe ;
- format de l'original : exemple 1 est. : eau-forte, burin ; 32,5 x 22,5 cm (élt d'impr.) ;
- format de la version numérisée : exemple : image/jpeg ;
- droits : droits d'utilisation (exemple : domaine public) ;
- identifiant : exemple : ark:/12148/btv1b6948042s ;
- source : exemple : Bibliothèque nationale de France, département Estampes et photographie, RESERVE QB-370 (25)-FT 4 [De Vinck, 4219 ;
- relation : Liens avec d'autres œuvres, lien vers la version numérique[6] ;
- provenance : en général bnf.fr ;
- description.
Histoire
Débuts à l'EPBF
Les premières numérisations datent de 1992, à la suite d'un projet de constitution d'une « collection d'images fixes numérisées » initié en 1990, du temps de l'Établissement Public de la Bibliothèque de France (EPBF)[7]. L'objectif est fixé à l'époque à 300 000 images fixes, avec l'idée de constituer des collections multimédias (incluant du son, des imprimés, des images fixes et animées). La Bibliothèque Nationale est alors démarchée pour participer au fonds, au même titre que des institutions privées ou encore des agences de photo.
À la suite de la fusion (décidée par François Mitterrand) en 1994 de la Bibliothèque Nationale et de l'EPBF, la nouvelle Bibliothèque nationale de France (BnF) accordera une plus large place aux collections issues de ses fonds propres dans le processus de numérisation ; ils représenteront rapidement la moitié du fonds numérique. Le service spécifique chargé jusqu'à la fusion d'acheter les ouvrages à numériser doit désormais travailler avec les départements thématiques de la BnF pour choisir dans leurs fonds et le Département de l’audiovisuel qui avait procédé principalement par acquisitions dans des collections extérieures est chargé de sélectionner des images fixes dans le fonds des départements spécialisés.
Lancement de Gallica
Le service web de Gallica est ouvert le [8]. Le projet a comme ambition de devenir la « bibliothèque virtuelle de l'honnête homme ». Elle propose alors un accès aux œuvres ainsi que des dossiers documentaires, notamment des textes et des images du XIXe siècle francophone. Le serveur stocke à ce moment 2 500 livres numérisés en mode image, ainsi que 250 livres numérisés en mode texte (issus de la base Frantext de l'Institut national de la langue française)[9]. Les livres sont classés par discipline, et accompagnés d'une chronologie du XIXe siècle, ainsi que de synthèses sur les grands courants en histoire, sciences politiques, droit, économie, littérature, philosophie, sciences et histoire des sciences. Enfin, un échantillon de la future iconothèque est disponible, avec un fonds du photographe Eugène Atget, une sélection de documents sur Pierre Loti, une collection d’images de l’École nationale des ponts et chaussées (sur les grands travaux de la révolution industrielle), et un choix de livres illustrés de la bibliothèque du Musée de l’Homme. À son lancement, Gallica est moins considéré comme une bibliothèque numérique que comme un « laboratoire dont l’objet est d’évaluer les conditions d’accès et de consultation à distance des documents numériques »[9].
Rapidement, le projet prend pourtant une ampleur très différente : au début de l'année 1998, Gallica annonce un objectif de 100 000 volumes et 300 000 images numérisées pour la fin 1999 (dont plus du tiers concernent le XIXe siècle). La moitié des 300 000 images doit provenir des départements spécialisés de la BnF, l'autre de collections d’établissements publics (musées et bibliothèques, Documentation française, École nationale des ponts et chaussées, Institut Pasteur, Observatoire de Paris par exemple) ou privés (agences de presse dont Magnum, l’Agence France-Presse, Sygma, Rapho). Mais dès la fin de l'année, la BnF revoit ses espérances à la baisse : selon Le Figaro, elle passe « d’une espérance universaliste, encyclopédique, à la nécessité de choix éditoriaux pointus », tandis que son président, Jean-Pierre Angremy, rapporte la décision du comité éditorial de Gallica en déclarant :
« Nous avons décidé d’abandonner l’idée d’un vaste corpus encyclopédique de cent mille livres, auquel on pourrait sans cesse reprocher des trous. Nous nous orientons aujourd’hui vers des corpus thématiques, aussi complets que possibles, mais plus restreints. […] Nous cherchons à répondre, en priorité, aux demandes des chercheurs et des lecteurs[10]. »
Une deuxième version est mise en ligne en 2000. Les livres et périodiques sont choisis titre par titre, tandis que les autres médias font l'objet de numérisation par grands ensembles. Le mode image est alors dominant, le mode texte restant limité à des textes saisis pour certains, notamment dans le cadre d'Analyse et traitement informatique de la langue française.
S’y ajoute par la suite un grand programme de numérisations de la presse quotidienne nationale française ainsi que de publications des sociétés savantes.
En 2005, en réponse à l'initiative de Google Recherche de livres, Jean-Noël Jeanneney publie Quand Google défie l'Europe[11], où il plaide pour une réaction européenne et notamment française. À la suite de cet appel, la Bibliothèque nationale de France s'engage dans la « numérisation de masse » avec une augmentation de la quantité des documents mis à disposition et le basculement progressif vers le mode texte par reconnaissance optique de caractères.
En novembre 2007 est passé un nouveau marché avec Safig qui prévoit la numérisation de 300 000 ouvrages par an sur trois ans[12], en mode image et en mode texte. Le choix individuel des livres est abandonné au profit d'un système de « tranches de cotes ».
Gallica2, troisième version de Gallica, a été engagée en novembre 2007, l'ancienne version restant alors provisoirement disponible. S'appuyant sur le robot d'indexation Lucene, elle se veut la synthèse de Gallica et du prototype Europeana. Gallica2 cherche à développer la personnalisation de l'interface.
Toujours pour répondre à Google, est lancé un projet d'intégration dans Gallica d'œuvres sous droits, en partenariat entre la Bibliothèque nationale de France, la Direction du livre et de la lecture, le Centre national du livre et le Syndicat national de l'édition. Le moteur de recherche donne accès à la fois aux documents libres et aux documents sous droits, les diffuseurs restant libres de décider des conditions de consultation du texte intégral. Gallica donne également accès à des bibliothèques virtuelles partenaires via le protocole OAI-PMH.
En mars 2009, l'interface qui avait été provisoirement maintenue est retirée de la consultation, conduisant à la réunification de Gallica et de Gallica2 et les collections spécialisées commencent à être numérisées. L'interface change à nouveau le [13].
Par ailleurs, le rapport de la mission Tessier, remis le , prévoit des évolutions de Gallica, qui pourrait la détacher de la BnF et la transformer en une interface de consultation de divers documents numérisés[14].
Le , L'Avenir est le 1 500 000e document numérisé.
Le , est mis en place à la Bibliothèque nationale de France un service Gallica intra muros donnant accès aux documents sous droits d'auteur, uniquement depuis la bibliothèque de recherche.
Accords de numérisation public/privé
Le , le ministère de la Culture et de la Communication, le Commissariat aux investissements d’avenir et la BnF annoncent conjointement la signature de deux accords de numérisation et de diffusion pour les livres anciens et les fonds musicaux de la BnF[15] dans le cadre du Programme d'investissements d'avenir, via la filiale BnF-Partenariats créée en 2012 :
- un accord avec la société ProQuest pour numériser 70 000 livres anciens français couvrant la période 1470 - 1700, qui concerne tous les incunables imprimés avant 1500 et un exemplaire par édition pour les imprimés des XVIe et XVIIe siècles. Au fil du temps, une sélection de 3 500 ouvrages choisis par la BnF sera en libre accès immédiat sur Gallica ; les autres titres ne seront disponibles sur la plateforme que dix ans plus tard ;
- un accord avec Believe Digital et Memnon Archiving Services pour numériser 200 000 disques vinyle 78 et 33 tours.
L'accord de numérisation porte sur des œuvres du domaine public uniquement, et prévoit une exclusivité de commercialisation des œuvres pour les entreprises partenaires. Or les principaux acheteurs des licences d’accès à ces contenus seront des organismes publics de recherche ou des bibliothèques universitaires, acteurs qui seront obligés de payer pour des contenus numérisés qui font partie du patrimoine culturel commun. Plusieurs organisations dénoncent cet aspect de l'accord, notamment le collectif Savoirscom1, l’association COMMUNIA, l’Open Knowledge Foundation France, les Creative Commons France, la Quadrature du Net, Framasoft, le Parti Pirate, Wikimédia France, l'Association des bibliothécaires de France ou encore le Front de Gauche[16].
Autres outils
En 2021, Benjamin Azoulay et Benoît de Courson créent Gallicagram[17], logiciel qui représente graphiquement l’évolution de l’usage des mots au cours du temps en fouillant les corpus de presse et de livres numérisés par Gallica et par diverses autres bibliothèques nationales et locales, en cinq langues[18],[19],[20].
Départements
Département des manuscrits (enluminures)
- Saint Augustin, Cité de Dieu
- Benoît de Sainte-Maure, Roman de Troie
- Boccace, Des cas des nobles hommes et femmes
- Boccace, Des claires et nobles femmes
- Chronique universelle
- Dialogue d'un chevalier et de Chrétienté
- Roman d'Énéas
- Flavius Josèphe, Antiquités judaïques
- Flavius Josèphe, Guerre des Juifs
- Grandes Chroniques de France
- Guyart des Moulins, Bible historiale
- Guillaume Fillastre, Toison d'Or
- Histoire ancienne jusqu'à César
- Histoire de Merlin
- Histoire du saint Graal
- Jean de Wavrin, Chroniques d'Angleterre
- Jean Mansel, Fleur des Histoires
- Lancelot du Lac
- Leonardo Bruni, Guerre punique
- Mort le roi Artu
- Ovide, Métamorphoses
- Pierre Choque, Réception d'Anne de Foix
- Queste del saint Graal
- Quinte-Curce, Histoire d'Alexandre le Grand
- Raoul Lefèvre, Histoires de Troyes
- Roman de Thèbes
- Romans de la Table Ronde
- Tite-Live, Histoire romaine
- Tristan de Léonois
- Trois fils de rois
- Valère Maxime, Faits et dits mémorables
Manuscrits orientaux
- Ahmedî, Iskender-nâma
- Kâtib Tchelebî, Djihân-Nüma
- Mîr Haydar, Mirâdj-nâma
- Tcherkes Aghâ Yûsuf Pâshâ, Safarnâme
- Zubdet el-Tevarikh
Département des arts du spectacle
Il propose de l'iconographie sur des spectacles de théâtre, danse, cirque et marionnettes.
Depuis 2010, sont en ligne 50 000 photographies contemporaines de spectacle : des photographies de Joël Verhoustraeten[21] et de Daniel Cande[22]. J. Verhoustraeten et D. Cande restent titulaires des droits d'exploitation mais ont accepté une mise sur internet de leurs images.
Département des cartes et plans
Des cartes, des plans réalisés à main levée ou lithographiés, les plus grands cartographes Gerardus Mercator, Jodocus Hondius, Wilhem Blaeuw, Nicolas de Fer, Sanson d'Abbeville, etc.
Département Sciences et techniques
Il propose des sources précieuses pour l'histoire des sciences.
Dans le cadre du pôle associé Numérisation concertée en mathématiques entre la Bibliothèque nationale de France et la Cellule MathDoc[23], le portail Gallica-Math a été constitué. Par une indexation fine des documents, il donne un accès aisé à une partie du fonds mathématique de Gallica[24] (Abel, Beltrami, Carnot, Cauchy, D'Alembert, Dirichlet, Euler, Fourier, Jacobi, Klein, Lagrange, Laguerre, Laplace, Möbius, Riemann), Journal de mathématiques pures et appliquées[25] créé par Liouville en 1836 et toujours vivant. En outre, la numérisation du Répertoire bibliographique des sciences mathématiques est complétée par une base de données[26] permettant des recherches fines, une navigation multiple dans le Répertoire et l'accès à nombre de documents originaux numérisés. Le catalogue LINUM[27] intègre les ouvrages de mathématiques de Gallica aux côtés d'autres bibliothèques étrangères (Cornell, Göttingen, Michigan). L'ensemble de ces documents est repris dans la mini-dml[28], exemple de service OAI d'une grande utilité pour les chercheurs mathématiciens.
Thématiques représentées
Gallica présente également des sélections éditorialisées où les documents sont regroupés en ensembles thématiques, géographiques ou par type de documents et accompagnés de textes de présentation :
- les Arts, loisirs et sport[29], dont la thématique du cheval et de l'équitation, avec 220 titres centrés et plus de 250 estampes en 2011, témoignant de la place centrale occupée par cet animal dans la culture et l'Histoire de France[30] ;
- le droit et l'économie[31] ;
- la littérature[32] ;
- l'histoire[33] ;
- les sciences[34] ;
- l'Afrique[35] ;
- les Amériques[36] ;
- l'Asie[37] ;
- l'Europe[38] ;
- la France[39] ;
- l'Orient ;
- les cartes et les globes[40] ;
- les enregistrements sonores[41] ;
- les images[42], telles les affiches, les estampes, les photographies ;
- les livres[43] ;
- les manuscrits[44] ;
- les objets[45], comprenant entre autres les monnaies, les médailles, les masques, les marionnettes, les objets d'art et les appareils d'enregistrement et de lecture de documents sonores, vidéo et multimédia ;
- les partitions[46] ;
- la presse et les revues[47] ;
- les vidéos[48] de documentaires et de conférences, dont quelques-unes consacrées à la Préhistoire et l'Antiquité[49].
Gallica marque blanche
À partir de 2013, la BnF propose aux bibliothèques souhaitant diffuser leurs contenus sans disposer de leur propre outil, d'utiliser Gallica en « marque blanche »[50]. L'application est développée et hébergée par la BnF mais un habillage propre permet à la bibliothèque de s'approprier l'outil.
La Bibliothèque nationale et universitaire de Strasbourg est le premier établissement à signer un partenariat avec la BnF pour sa bibliothèque numérique Numistral qui ouvre au public le 4 octobre 2013[51]. En janvier 2020 ce sont 8 bibliothèques numériques qui sont propulsées par Gallica marque blanche[52].
Notes et références
- « 6 millions de documents numérisés dans Gallica ! », sur bnf.fr, (consulté le ).
- « 8 millions de documents numérisés dans Gallica ! », sur bnf.fr (consulté le ).
- Bibliothèque nationale de France, « Plusieurs millions de documents à portée de main », sur bnf.fr (consulté le ).
- La BNF et le numérique patrimonial et culturel, La lettre du COEPIA, no 28, février 2015.
- « A propos », sur gallica.bnf.fr (consulté le )
- Bibliothèque nationale de France, « Notice bibliographique », sur catalogue.bnf.fr, (consulté le ).
- Les images fixes numérisées à la Bibliothèque nationale de France, Bulletin des bibliothèques de France.
- Daniel Renoult, Jacqueline Melet-Sanson et Marcelle Beaudiquez, La Bibliothèque nationale de France, Éditions du Cercle de la Librairie, , p. 199.
- L'ebook a 40 ans > 1997 > Gallica, bibliothèque numérique, Actualité.
- Le livre, de l'imprimé au numérique - Marie Lebert, 2010 (Projet Gutenberg).
- Jean-Noël Jeanneney, Quand Google défie l'Europe : plaidoyer pour un sursaut, Paris, Mille et une nuits, impr. 2010, 219 p. (ISBN 978-2-7555-0568-9).
- Bibliothèque Nat. de France : 3 ans pour numériser 300.000 livres - Numerama.
- « Une nouvelle interface pour Gallica » sur le blog de Gallica.
- Remise du rapport sur la numérisation du patrimoine écrit, sur le site du ministère de la Culture.
- Investissements d'Avenir : Deux partenariats d'envergure conclus pour la numérisation et la diffusion des collections de la Bibliothèque nationale de France (BnF) - Ministère de la Culture et de la Communication.
- Non à la privatisation du domaine public par la Bibliothèque nationale de France ! - Savoirscom1.
- https://osf.io/preprints/socarxiv/84bf3.
- https://api.bnf.fr/fr/gallicagram-un-outil-de-lexicographie.
- https://litrev.hypotheses.org/2449.
- https://odhn.ens.psl.eu/newsroom/gallicagram-un-outil-de-lexicometrie-pour-la-recherche.
- « Recherche sur Gallica / joel verhoustraeten / image / 694 résultats », sur gallica.bnf.fr (consulté le ).
- « Recherche sur Gallica / daniel cande / image / 2278 résultats », sur gallica.bnf.fr (consulté le ).
- Site de la Cellule MathDoc.
- Œuvres complètes de mathématiciens historiques, sur portail.mathdoc.fr.
- Lien direct vers le Journal de mathématiques pures et appliquées, sur portail.mathdoc.fr.
- Lien vers la base RBSM, sur portail.mathdoc.fr.
- LINUM, sur portail.mathdoc.fr.
- mini-dml.
- Bibliothèque nationale de France, « Arts Loisirs Sports accueil », sur gallica.bnf.fr, (consulté le ).
- Arnaud Dhermy, « Le cheval et les ressources numériques de Gallica, patrimoine diffus d’une bibliothèque coopérative », In Situ. Revue des patrimoines, (ISSN 1630-7305, DOI 10.4000/insitu.9740, lire en ligne, consulté le ).
- Bibliothèque nationale de France, « Droit, Economie, Politique », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Littérature », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Histoire », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Sciences », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Afrique », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Amériques », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Asie », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Europe », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « France », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Cartes », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Fonds sonores », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Images », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Livres », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Manuscrits », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Objets », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Partitions », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Presse et revues », sur gallica.bnf.fr, (consulté le ).
- Bibliothèque nationale de France, « Vidéos », sur gallica.bnf.fr, (consulté le ).
- Hypothèse.org, « 1 000 vidéos disponibles dans Gallica », sur L’Antiquité à la BnF, (ISSN 2555-1159, consulté le ).
- « Bienvenue à Numistral, la bibliothèque numérique de la BNU ! », (consulté le ).
- « Ouverture de Numistral, la bibliothèque numérique de la BNU », sur eduscol.education.fr, (consulté le ).
- « Rosalis la bibliothèque numérique patrimoniale de Toulouse fait peau neuve », sur bnf.fr (consulté le ).
Voir aussi
Articles connexes
- Bibliothèque nationale de France
- Europeana
- Google Livres
- Bibliothèque idéale
Liens externes
Médias utilisés sur cette page
Logo of Gallica digital library of the National Library of France.