Qu’est-ce que le protocole OAI-PMH ?

Plusieurs services d’Huma-Num propose le protocole OAI-PMH. Qu’est-ce que cela signifie ? Que permet l’OAI-PMH ? Comment ce protocole fonctionne-t-il ?

A quoi sert l’OAI-PMH ?

OAI-PMH est un moyen pour échanger des métadonnées sur internet, de façon automatisée.

OAI-PMH permet d’une part à un fournisseur d’exposer les métadonnées de ses ressources dans des entrepôts.

Il permet d’autre part de collecter les métadonnées présentes dans ces entrepôts, par exemple pour les exposer ailleurs ou fournir des services supplémentaires (enrichissement des métadonnées, moteur de recherche, etc.).

OAI-PMH constitue donc une “sur-couche” à HTTP, le protocole standard du web et définit six verbes d’interrogations spécifiques.

L’OAI-PMH chez Huma-Num

Plusieurs services d’Huma-Num reposent sur le protocole OAI-PMH. Le moteur de recherche ISIDORE par exemple, collecte via OAI-PMH les données à indexer. Le service NAKALA met en oeuvre le protocole OAI-PMH pour permettre la collecte de ses métadonnées.

L’histoire de l’OAI-PMH

L’OAI-PMH (Open Archive Initiative - Protocol for Metadata Harvesting ) est un protocole standard interopérable qui permet l’accès aux métadonnées d’un entrepôt numérique. Il a été mis au point en 1999 par l’Open Archives Initiative pour faciliter l’échange et la visibilité des données stockées dans les archives ouvertes (par exemple des entrepôts d’articles scientifiques mis à disposition par les chercheurs eux-mêmes). Il s’est peu à peu diffusé dans d’autres domaines, notamment dans le milieu du patrimoine et des bibliothèques numériques, du fait de sa simplicité et de la disponibilité de nombreux outils.

Dans quel(s) cas peut-on utiliser le protocole OAI-PMH ?

Le protocole OAI-PMH est particulièrement utile dans le cas des bases de données. Si d’un côté, les données contenues dans ces bases peuvent être affichées dynamiquement dans des pages web, faire l’objet de requêtes, etc., il est toujours souhaitable de d’en permettre également l’interrogation conformément au protocole OAI-PMH afin que les métadonnées puissent être moissonnées par des moteurs de recherche.

Comment fonctionne l’OAI-PMH ?

Le protocole OAI-PMH implique deux acteurs :

  • Le fournisseur de données (data provider) qui expose, grâce à une interface Web spécifique, les métadonnées des différents enregistrements contenus dans son entrepôt.
  • Le fournisseur de services (service provider) qui moissonne un ou plusieurs entrepôts, en utilisant les interfaces exposées par le fournisseur de données, afin d’offrir aux utilisateurs des interfaces de recherche ou de navigation.

Un 3eme rôle d’agrégateur a été définit comme un fournisseur de service qui à son tour ré-exposer ce qu’il a moissonné à d’autres fournisseurs de services.

Prenons l’exemple du moteur de recherche ISIDORE (http://rechercheisidore.fr), initiée par Huma-Num. ISIDORE est un fournisseur de services qui collecte puis indexe les métadonnées présentes dans les entrepôts de plusieurs fournisseurs de données (Persée, Cairn, Gallica et plusieurs centaines d’autres) selon le standard OAI-PMH.

Dans un entrepôt OAI-PMH, chaque ressource stockée correspond à une notice (aussi appelée « enregistrement » ou « record »). Chaque notice ou enregistrement est obligatoirement décrit à l’aide de métadonnées respectant a minima le Dublin Core simple (voir la fiche consacrée au DublinCore). Il est possible de décrire les métadonnées, en plus du Dublin Core simple, à l’aide de vocabulaires plus riches : DC Terms, MODS, OLAC, etc.

Ces notices peuvent être rassemblés en différents ensembles (appelés « set »). Ces sets peuvent, par exemple, être organisés hiérarchiquement. Un enregistrement peut en outre appartenir à plusieurs ensembles. Prenons un exemple : une collection de photographies. Chaque cliché est décrit individuellement (une notice par objet). Ces notices ou enregistrement peuvent être regroupé dans un ensemble (clichés du photographe X). Selon les besoins, une photographie pourra appartenir à plusieurs sets (photographe X ;  provenance collection Y, etc.)

Dans l’OAI-PMH, pour un document, plusieurs formats de métadonnées peuvent être proposés suivant les usages (Dublin Core simple, DC Terms, MODS, OLAC…). Un entrepôt OAI-PMH signale la présence de plusieurs formats de métadonnées grâce à une requête spécifique.

Pour en savoir plus

Moyenne des notes : 5 (1 Vote)

Vous ne pouvez pas commenter cet enregistrement