ISIDORE

En francésEn inglés

¿Qué es ISIDORE?

ISIDORE es un motor de búsqueda para descubrir y encontrar publicaciones, datos digitales y perfiles de investigadores en humanidades y ciencias sociales (SHS) de todo el mundo.

Le permite buscar el texto completo de varios millones de documentos (artículos, tesis y disertaciones, informes, conjuntos de datos, páginas web, registros de bases de datos, descripción de colecciones de archivos, etc.), informes de eventos (seminarios, conferencias, etc.). Además, ISIDORE vincula estos millones de documentos enriqueciéndolos con la ayuda de conceptos científicos resultantes del trabajo de las comunidades de investigación de SHS.

Está accesible en la Web en el portal isidore.science.

También ofrece funciones científicas de redes sociales. Como tal, entra en la categoría de motores de búsqueda y asistentes y ofrece muchas funciones para organizar el seguimiento científico.

Lanzado el 8 de diciembre de 2010, ISIDORE es el resultado de la colaboración del “gran equipo” Adonis del CNRS (2007-2013), el Centro de comunicación científica directa y las empresas Antidot, Mondéca y Sword. Actualmente es desarrollado, actualizado y operado por IR* Huma-Num.

Referencias sobre la historia de ISIDORE:

  • POUYLLAU, Stéphane, CAPELLI, Laurent, MINEL, Jean-Luc, BUNEL, Mélanie, SAURET, Nicolas, BAUDE, Olivier, JOUGUET, Hélène, BUSONERA, Pauline, & DESSEIGNE, Adrien. (2021). ISIDORE a los 10 años. Zenodo. 10.5281/zenodo.5699997
  • Philippe Bourdenet, “Espacio documental en reestructuración: la evolución de los servicios bibliotecarios universitarios”, El servidor TEL (thèses-en-ligne), 10670/1.lnieuv
  • Yannick Maignien, “ISIDORE, de la interconexión de datos a la integración de servicios”, Hyper Article Online - Human and Social Sciences, 10670/1.k9lck9
  • Stéphane Pouyllau et al., “Revisión de 2011 de la plataforma ISIDORE y perspectivas para 2012-2015”, MoDyCo, Models, Dynamics, Corpus - UMR 7114, 10670/1.bqexsj

¿Cómo funciona ISIDORE?

ISIDORE recolecta metadatos de texto y texto completo, lo enriquece y luego lo indexa. Explota los metadatos de los documentos así como el texto completo, el objetivo es analizar esta información para enriquecerla, vincularla a los conceptos de repositorios científicos (tesauro, etc.), vincularla a los identificadores de los autores (ORCID, IDRef, IDHAL, VIAF, etc.).

Se realizan varias mejoras:

  • Anotación semántica: las palabras presentes en los metadatos de los documentos se comparan con las entradas de los repositorios mediante un algoritmo basado en un análisis morfológico de los términos. Si se hace una equivalencia entre un término del documento y una entrada en uno de los repositorios, entonces el recurso se vinculará a dicha entrada en el repositorio. Los repositorios son multilingües y están alineados entre sí. Así, la anotación semántica es multilingüe.

  • Categorización disciplinar: ISIDORE utiliza un clasificador semántico que, tras haber sido entrenado sobre un corpus de referencia, categoriza en las disciplinas SHS del repositorio MORESS, todos los documentos presentes en ISIDORE. El entrenamiento del clasificador se realiza utilizando la categorización manual que realizan los investigadores en HAL al depositar sus publicaciones.

  • Detección de autor: ISIDORE detecta los autores de los documentos y enriquece la forma de autor (nombre y apellido) utilizando identificadores de autor internacionales (ORCID, VIAF, ISNI) y nacionales (IDHAL, IDRef).

ISIDORE indexa, en su buscador:

  • metadatos del documento;
  • El texto completo (si está disponible en acceso abierto);
  • Anotaciones semánticas;
  • clasificación disciplinaria;
  • Enriquecimiento y estandarización de autores.

Hay más información disponible en la página de “Repositorios” de ISIDORE.

¿ISIDORE puede indexar documentos y datos multilingües?

Sí. Desde 2015, documentos y conjuntos de datos en inglés, español y el francés están indexados, enriquecidos y vinculados a repositorios científicos por ISIDORE (metadatos y texto completo). Para el texto completo fuera de estos tres idiomas, se indexa en el idioma del documento. Para más información, puedes consultar nuestro post sobre el tema: Isidore habla inglés, sino también español y siempre en francés.

¿Con qué frecuencia se actualiza ISIDORE?

ISIDORE se actualiza diariamente.

¿Cuál es el circuito para agregar colecciones en ISIDORE?

ISIDORE recopila “colecciones” de documentos y datos, que es el término utilizado en ISIDORE. Estas colecciones pueden ser almacenes de datos o bases de datos que contengan metadatos, datos y enlaces a estos datos.

Dos escenarios:

  • Un proyecto de investigación, un equipo, un laboratorio, una biblioteca pueden proponer colecciones para recolectar por simple correo electrónico a isidore-sources@huma-num.fr . El equipo de Huma-Num estudia la solicitud y los intercambios con el solicitante para comprender completamente cómo se describen los metadatos y los datos que se indexarán. La mayoría de las veces, se lleva a cabo una recolección inicial y una indexación y enriquecimiento inicial para que el solicitante pueda ver y analizar cómo se indexarán sus datos en ISIDORE. Luego, los intercambios potencialmente continúan ajustando el proceso de indexación lo mejor posible.

  • El equipo de Huma-Num identifica un almacén de datos o una biblioteca digital y contacta con el productor de datos o la estructura que difunde estos datos para intercambiar y proponer su recolección e indexación en ISIDORE. Se realiza una primera recolección y una primera indexación y enriquecimiento para que el solicitante pueda ver y analizar cómo se indexarán sus datos en ISIDORE. Luego, los intercambios potencialmente continúan ajustando el proceso de indexación lo mejor posible.

¿Cómo usar ISIDORE ?

ISIDORE ofrece varias herramientas para buscar, descubrir, recopilar y organizar el contenido que indexa:

El portal “isidore.science”

El portal isidore.science es un sitio web trilingüe que ofrece un motor de búsqueda por relevancia que se puede utilizar con múltiples métodos de búsqueda.

  • Por defecto, ISIDORE busca todas las palabras de una consulta planteada por el usuario eliminando las palabras vacías (“de”, “la”, “le”, “el”, etc.);
  • Es posible buscar un documento con una oración completa o un grupo de palabras usando comillas alrededor de la oración, por ejemplo: “dirección de la conciencia” buscará precisamente esta frase. Así, en este caso, no se considerará el “de” como una palabra vacía;

Operadores de búsqueda

Varios operadores de búsqueda booleanos están disponibles en ISIDORE. Tenga en cuenta que la sintaxis del operador es importante en ISIDORE, siempre están en MAYÚSCULAS (ej. AND):

  • AND (AND): la intersección permite encontrar los términos (o términos) comunes a la consulta. Por ejemplo :
    • conciencia Y género
    • “guerra fría” Y migraciones
  • OR (OR): la combinación permite encontrar los términos buscados pertenecientes a ambos conjuntos de términos, o a uno o al otro. Por ejemplo :
    • “Web Semántica” O “Web 3.0”
  • EXCEPT (NOT): la exclusión se utiliza para reducir el ruido excluyendo términos. Por ejemplo :
    • revolución EXCEPTO francés
  • NEAR(n.) (NEAR(n.)): el operador NEAR(n.) (entender “near de”) le permite vincular términos indicando un valor “n”. proximidad entre ellos. Funciona como un AND con n. palabra(s) entre términos. El valor “n”. indica el número de palabras para separar los dos términos de búsqueda. CERCA también funciona sin el valor n. y es en este caso igual a NEAR(10), es decir 10 palabras entre los términos de búsqueda (espaciado estándar).
    • casa NEAR(4) nobleza: busca casa y nobleza con una proximidad de 4 palabras

Clasificación de resultados de búsqueda

De forma predeterminada, en isidore.science, los resultados se ordenan por relevancia semántica. Es posible cambiar la clasificación de los resultados de búsqueda a:

  • clasificación por novedad
  • clasificación en el nombre del autor en orden alfabético
  • clasificación según el nombre del autor en orden alfabético inverso
  • ordenar por fecha ascendente
  • ordenar por fecha descendente
  • clasificación en el título en orden alfabético
  • una toma en el título en orden alfabético inverso

Se necesita una cuenta [HumanID] (./humanid.md) para que funcione.

Búsqueda Avanzada

Una búsqueda avanzada también está disponible en https://isidore.science/as y también accesible desde la portada del portal.

Espacio personal para investigadores

Isidore.science ofrece un espacio personal para investigadores y doctorandos que permite:

  • recoger, clasificar, organizar los documentos encontrados;
  • agrupar toda su producción científica para editorializarla en una página de perfil personal;
  • seguir las producciones de los colegas;
  • registrar y publicar sus solicitudes y sus resultados con fines de seguimiento;
  • crear bibliografías que se pueden exportar a Zotero;

Las API de isidore.science

Las API del motor de búsqueda de isidore.science están disponibles en la URL https://api.isidore.science por el GET método sobre HTTP o HTTPS. Ofrecen un servicio de consulta de datos ISIDORE rápido, preciso y fiable con elaboradas funciones de búsqueda (autocompletado, corrección ortográfica, multicriterio, búsquedas booleanas y por facetas, clasificación, agregación de respuestas, etc.).

Cada solicitud al motor se envía mediante un URI que apunta a un servicio web específico. La respuesta es un feed en formato XML (formato predeterminado) o JSON.

La página web isidore.science API detalla todos los comandos disponibles para los diferentes servicios disponibles.

Atención

A partir del 15 de septiembre de 2023. ISIDORE ya no ofrece RDF tripleStore y SPARQL endpoint.

Complementariedad entre ISIDORE y Zotero

Uso de ISIDORE del conector Zotero para alimentar su base de datos bibliográfica

ISIDORE es compatible con Zotero y permite importar referencias de documentos en dos niveles una vez que el usuario ha instalado el conector de Zotero en su navegador:

  • En la página que enumera los resultados de una búsqueda,
  • En la página de visualización de documentos.

Usando el conector de búsqueda ISIDORE y Zotero

Zotero (cliente Linux, MacOS, Windows) le permite utilizar motores de búsqueda para buscar o completar referencias bibliográficas directamente desde la interfaz de Zotero. Proponemos aquí dos conectores ISIDORE para Zotero que permiten utilizar ISIDORE desde la búsqueda de autores.

Agregar ISIDORE a Zotero permite:

  • Para completar referencias a partir de una búsqueda sobre el nombre del autor: esto es “ISIDORE, ayúdame a encontrar lo que ha publicado”.
  • Para encontrar documentos en los que se cita al autor: es el “ISIDORE, ¿qué tienes del autor/autora?”

Estos conectores y documentación de instalación están disponibles en el GitLab de IR* Huma-Num.

Uso de fuentes RSS

ISIDORE puede ofrecer sus resultados de investigación en forma de fuentes RSS para suministrar software de seguimiento científico (incluido Zotero, por ejemplo), cuadernos de investigación, etc. Los canales RSS creados en ISIDORE se actualizan, como todos los contenidos de los buscadores, aproximadamente una vez al mes durante la actualización general de contenidos de ISIDORE. Así, es posible seguir, desde Zotero, la actualización de los documentos ISIDORE resultantes de las solicitudes registradas.

Para eso, tienes que preguntarle a ISIDORE — en su espacio personal en modo conectado, el enlace a la fuente RSS de una consulta guardada en yendo, una vez en tu espacio personal, en “Mis solicitudes”:

Mi Imagen

Para una solicitud guardada, debe hacer clic en el pictograma “Flow” RSS de la solicitud” disponible a la derechaMi Imagen y copie el enlace con Mi Imagen.

El enlace copiado tiene el formato: https://isidore.science/feed/lt3913.

Si su navegador está equipado con un módulo para leer fuentes RSS, será posible utilizar este enlace directamente en su navegador. En nuestro ejemplo, lo usaremos en Zotero.

En Zotero, elige: Nueva fuente > Desde URI:

Mi imagen

Luego agregue la url del feed proporcionado por ISIDORE (con el navegador Safari en MacOS tenga cuidado de eliminar la mención “feed:” de la dirección URL). Luego péguelo en “URL” de la ventana de creación Fuente RSS de Zotero, ejemplo a continuación:

Mi foto

A continuación, debe dar un título a su feed, por ejemplo: “isidore.science - vela por…”.

¿Qué hay en ISIDORE?

Organización de documentos y datos en ISIDORE

ISIDORE contiene varios millones de documentos en SHS que son recolectados, enriquecidos con repositorios científicos e indexados. Se organizan en:

  • Documentos y datos de investigación (archivos, materias primas, fotografías, películas, conjuntos de datos, estadísticas, etc.) y están identificados en la ontología ISIDORE por: http://isidore.science/class/ primario
  • Documentos y datos publicados (artículos, libros, disertaciones y tesis, informes, etc.) y están identificados en la ontología ISIDORE por: http://isidore.science/class/secondaires
  • Eventos científicos (conferencias, jornadas de estudio, etc.) y están identificados en la ontología ISIDORE por: http://isidore.science/class/evenementielles

Para una gran cantidad de disciplinas de SHS, ISIDORE hace posible la búsqueda de documentos de las principales plataformas de publicación de todo el mundo, así como una gran cantidad de colecciones digitalizadas por bibliotecas nacionales, universitarias y nacionales. municipal. Para usos de investigación avanzada, la búsqueda avanzada de ISIDORE ofrece, por ejemplo, la posibilidad de buscar documentos entre dos fechas y por disciplina o incluso por colecciones.

Las principales plataformas de publicación (revistas y libros) presentes en ISIDORE son:

  • Open Edition
  • Cairn
  • Persée
  • Erudit
  • Redalyc
  • Scielo

La lista completa de colecciones que contienen publicaciones se puede obtener consultando en el buscador.

Las principales bibliotecas digitales (municipales, nacionales, etc.) presentes en ISIDORE son:

  • Gallica (BnF)
  • BNE
  • E-rara
  • NuBIS
  • Octaviana
  • Biblioteca de hamburguesas
  • Colecciones digitales de la biblioteca de Berkeley
  • Argonauta
  • BNE
  • Cornell University
  • Didόmena

Organización de documentos y datos por tipos en ISIDORE

La ontología tipos de ISIDORE

ISIDORE también clasifica documentos y datos por su naturaleza, o sus tipos: es decir, por artículos, conjuntos de datos, fotografías, tesis, etc. Esto permite ofrecer el filtro “Tipo de documento” en la interfaz de respuesta de isidore.science.

La mayoría de las bases de datos o almacenes de datos que alimentan a ISIDORE utilizan uno o más vocabularios estandarizados para expresar estos tipos. La mayoría de las veces se expresan utilizando metadatos en Dublin Core (Conjunto de elementos o Términos, consulte la sección sobre OAI y RDFa a continuación) y, aunque existen repositorios de tipos (consulte COAR a continuación), encontramos un heterogeneidad muy grande entre los productores de datos.

Con el fin de reunir el mayor número posible de documentos en una serie exhaustiva de tipos, ISIDORE realiza sobre ellos varios tratamientos. Esto implica principalmente agrupar y organizar los tipos a partir del tipo proporcionado por el productor de datos y alinearlo con URI de repositorios internacionales. Estos procesos de agrupación se realizan mediante una “ontología de tipos de ISIDORE” cuyas entradas están alineadas con los repositorios internacionales COAR, BIBO, RDFS, DCAT, Wikidata.

La ontología ISIDORE tipos está disponible en línea en XML (SKOS/RDF).

En la medida en que es un procesamiento realizado por ISIDORE, cabe señalar que las etiquetas de la ontología de los tipos de ISIDORE están disponibles en inglés, francés y español como el resto de los enriquecimientos creados por ISIDORE.

Alineación de tipos en las ontologías ISIDORE y NAKALA

En el ecosistema Huma-Num, desde el rediseño de NAKALA en 2020, el repositorio de tipos es el repositorio internacional “COAR” (Confederación de Repositorios de Acceso Abierto) desarrollado en 2008 como parte del programa europeo DRIVER y ampliamente utilizado internacionalmente en la mayoría de las plataformas de datos científicos (OpenAIRE, etc.).

En 2020 se implementó un alineamiento de los tipos de ontología de ISIDORE y NAKALA, utilizando COAR. Esta alineación se utiliza tanto en la interfaz de depósito de datos de NAKALA (alimenta la lista desplegable “Tipo de depósito”) como en ISIDORE en la ontología de tipos. Esta alineación se puede obtener :

Nota

Se ofrecerá una presentación cruzada de las 3 tiendas tan pronto como NAKALA ofrezca una 3 tienda en su nueva versión. Actualmente es posible utilizar las API de NAKALA e ISIDORE para ello.

Indexación de las principales plataformas de datos SHS

ISIDORE recolecta, es el término establecido, luego indexa el contenido de numerosas plataformas de datos en SHS, lo que permite a los investigadores agrupar todos sus datos en su perfil de usuario. Alentamos a los investigadores, para sus programas de investigación, a utilizar plataformas que ofrezcan dispositivos y protocolos abiertos de interoperabilidad para la presentación de metadatos documentales y científicos.

Las principales plataformas de datos (fuentes, archivos pero también publicaciones) son recopiladas por ISIDORE.

No dude en hacérnoslo saber.

¿Los datos depositados y documentados en NAKALA pueden ser referenciados por ISIDORE?

Sí, los datos depositados y documentados en NAKALA pueden ser accesible en ISIDORE. NAKALA ofrece como estándar el protocolo de interoperabilidad OAI-PMH que permite recolectar, este es el término establecido, los metadatos de los documentos, y por lo tanto para referenciarlos, enriquecerlos e indexarlos por ISIDORE.

Sin embargo, la referenciación por recolección OAI-PMH no es automática por el momento, en particular para permitir a los usuarios preparar y organizar sus datos y metadatos. Para ser referenciado, por el momento, debe solicitarse por correo electrónico para ser indexado ISIDORE a través de [isidore-sources@huma-num.fr] (mailto:isidore-sources@huma-num.fr).

¿Cómo serán accesibles en ISIDORE los artículos científicos y las imágenes depositadas en el archivo abierto HAL, HAL-SHS y MédiHAL?

Todos los archivos (PDF, ilustraciones, fotografías, audio y video) depositados y documentados en el archivo abierto de HAL, incluidos HAL-SHS, así como MédiHAL, se referencian automáticamente en ISIDORE y se indexan a nivel de sus metadatos. Todos estos documentos y sus avisos son, por tanto, accesibles a través de las distintas interfaces de consulta de ISIDORE.

¿Los datos depositados en el almacén de Didómena (EHESS) pueden ser referenciados por ISIDORE?

Sí, Didómena (el almacén de datos de investigación de EHESS) ofrece interoperabilidad OAI-PMH. Tenga en cuenta que la recolección no es automática. Para ser referenciado en su colección, envíenos el punto de acceso OAI-PMH a través de isidore-sources@huma-num.fr.

¿Los datos depositados en el almacén de Data.sciencespo pueden ser referenciados por ISIDORE?

Sí, los datos depositados y documentados en Data.sciencespo (Dataverse) ofrecen interoperabilidad OAI-PMH. Es cosechado automáticamente por ISIDORE.

Los datos depositados en la plataforma ¿COCOON puede ser referenciado por ISIDORE?

Sí, los datos depositados y documentados en la plataforma COCOON ofrecen interoperabilidad OAI-PMH. Esta plataforma es recolectada automáticamente por ISIDORE.

¿Los archivos y documentos depositados en la plataforma europea Zenodo pueden ser referenciados por ISIDORE?

Sí, es posible que ISIDORE haga referencia a los archivos y documentos archivados y documentados en la plataforma Zenodo.

La referenciación se basa en el principio de recolección OAI-PMH en un conjunto de ficheros y datos (y por tanto sus metadatos) correspondientes a uno o identificador(es) correspondiente(s) a los identificadores de “comunidades” en Zenodo (ver https://developers.zenodo.org/#sets). También podemos combinar varios identificadores de Zenodo en un solo colección ISIDORE permitiendo así a los depositantes de varios corpus depositado en Zenodo para agruparlos en ISIDORE para darles más de visibilidad

¿Las bibliotecas digitales que utilicen “Gallica marca blanca” pueden ser referenciadas por ISIDORE como colección ISIDORE?

Sí, porque la BnF expone según el protocolo OAI-PMH los contenidos de la biblioteca digital mediante “Marca blanca Gallica” en forma de a “Establecer” OAI-PMH. Para ser referenciado en su colección, envíenos el punto de acceso OAI-PMH a través de isidore-sources@huma-num.fr.

¿ISIDORE puede cosechar los sitios Omeka implementados por INIST-CNRS?

Sí, los sitios creados por INIST-CNRS como parte de su oferta de servicio de sitio usando Omeka pueden ser reportado en ISIDORE como una colección. Los metadatos se pueden recopilar y, por lo tanto, ISIDORE puede indexar y enriquecer los datos, incluido el texto completo (PDF, XML, etc.). INIST ofrece una página dedicada a su oferta: https://www.inist.fr/realisations/omeka-pour-des-bases-de-donnees-valorisees/.

¿Cómo obtengo datos referenciados por ISIDORE?

Hay varias formas de hacer referencia a datos y documentos por ISIDORE:

Estos dos métodos también suelen implementarse mediante herramientas de publicación de datos (CMS, SIGB, etc.), por ejemplo:

¿Cómo reportar tus datos en ISIDORE con metadatos y el protocolo OAI-PMH?

Para reportar tus datos en ISIDORE utilizando el protocolo OAI-PMH, todo lo que tiene que hacer es:

  • Preparar sus datos y metadatos utilizando el vocabulario documental Dublin Core Element Set o el Dublin Core Términos, dependiendo del nivel de precisión deseado y hacer accesible mediante el protocolo OAI-PMH;
  • Organizar y documentar los Sets de su almacén OAI-PMH
  • Informar a isidore-sources@huma-num.fr de la dirección de su almacén en Huma-Num.

Conjuntos de documentos en OAI-PMH: Sets

El protocolo OAI-PMH permite, mediante la creación de Sets, reunir en uno conjunto coherente de registros cuyo perímetro tiene sentido desde un punto de vista científico o editorial y que se deja a discreción del productor de datos.

También permite definir una jerarquía en los Sets con un mecanismo de herencia especificando en el nombre del conjunto el nombre del padre Sets y del hijo Conjunto separados por el carácter :. ISIDORE es capaz de utilizar estos Sets para limitar la cosecha a un conjunto de registros o a diferenciar diferentes fuentes de datos dentro del mismo almacén. Por lo tanto, el productor deberá especificar los métodos de recolección. parezca la más adecuada para hacer el mejor uso de sus recursos dentro de ISIDORE. Para ello indicará el Sets preocupado o una regla que permita distinguir los Sets* a tener en cuenta.

Para más información

Sets puede corresponder a la noción de collections en almacén de datos digital como NAKALA, Didόmena, MédiHAL, Recherche Data Gouv, etc.

Conjuntos pueden presentar metadatos, en Dublin Core Element Set, propios. Por ejemplo :

<conjunto>
  <setSpec>OpenColl</setSpec>
  <setName>Libros</setName>
  <conjuntoDescripción>
   <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms= "http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/ OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
    <dc:description>Trabajos de investigación publicados en Cairn.info</dc:description>
   </oai_dc:dc>
  </conjuntoDescripción>
</conjunto>

Registros en OAI-PMH o Registros:

Dentro de ISIDORE, cada registro OAI-PMH corresponde a un documento. El recolector ISIDORE utiliza así los metadatos descritos según el perfil de aplicación definido por la Open Archive Initiative para el Conjunto de elementos Dublin Core (también conocido como Dublin Core “simple”). De además, el recolector también recopila los documentos de texto full cuyas URL (que comienzan con https:// o http://) se indican en el elemento <dc:identifier>.

Recomendamos que los productores de datos proporcionen registros como tan rico como sea posible en metadatos. En efecto, la relevancia ISIDORE favorece los metadatos más ricos posibles.

Como mínimo, los siguientes campos de Dublin Core Element Set o Dublin Core TERMS son obligatorios:

<dc:título>
<dc:creador>
<dc:fecha>

O :

<dcterms:título>
<dcterms:creador>
<dcterms:fecha>

Sin embargo, se recomienda encarecidamente el campo <dcterms:description> para mejorar la indexación y, por lo tanto, el posicionamiento en los resultados de búsqueda de los documentos.

Recomendación de estandarización

Autores

ISIDORE es capaz de detectar las formas de los autores para acercarlos a sus identificadores (IdRef, Orcid, etc. ver arriba). Esto funciona a partir de una cierta estandarización de los metadatos <dc:creator> o <dcterms:creator>: ISIDORE puede configurarse para detectar las siguientes formas (nombre = %p, apellido = %n, fechas de nacimiento y muerte = (%t)):

  • %n, %p
  • % p % n
  • %n, %p (%t)

Así como todas las demás formas compuestas de estos tres elementos.

Fechas

ISIDORE es capaz de detectar fechas. Esto funciona a partir de cierta normalización de los metadatos <dc:date> o <dcterms:date> de las siguientes formas:

Enlaces a texto completo o archivo adjunto

Es importante que los metadatos (vía OAI o Sitemap+RDFa) proporcionen acceso a una página web de acceso abierto, archivo PDF o XML utilizando un <dc:identifier/> a través de una URL en HTTPS.

Ejemplo de registro completo según protocolo OAI-PMH:

Ejemplo en Conjunto de elementos de Dublin Core:

<registro>
  <encabezado>
   <identify>oai:halshs.archives-ouvertes.fr:halshs-00514304</identify>
   <marca de fecha>2010-09-02T11:06:50Z</marca de fecha>
   <setSpec>halshes</setSpec>
   <setSpec>SHS:ECO</setSpec>
   <setSpec>SDV:BIO</setSpec>
   <setSpec>INFO:INFO_BT</setSpec>
   <setSpec>SDV:SA:AEP</setSpec>
   <setSpec>SDV:SA:STA</setSpec>
   <setSpec>CIRAD</setSpec>
   <setSpec>SHS</setSpec>
  </encabezado>
  <metadatos>
   <oai_dc:dc xsi:schemaLocation=”http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd”>
   <dc:identificador>http://halshs.archives-ouvertes.fr/halshs-00514304/en/ </dc:identificador>
   <dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/Regulation_GMO_pprint.pdf</dc:identifier>
   <dc:identifier>http://halshs.archives-ouvertes.fr/docs/00/51/43/98/PDF/ppt_nocmt_broader_regulation.pdf </dc:identifier>
   <dc:title>Ampliación del alcance de la regulación: un requisito previo para una contribución positiva del uso de cultivos transgénicos al desarrollo sostenible</dc:title>
   <dc:creator>Fok, Michael</dc:creator>
   <dc:subject>[SHS:ECO] Humanidades y Ciencias Sociales/Economía y finanzas </dc:subject>
   <dc:subject>[SDV:BIO] Ciencias biológicas/Biotecnología</dc:subject>
   <dc:subject>[INFO:INFO_BT] Informática/Biotecnología</dc:subject>
   <dc:subject>[SDV:SA:AEP] Ciencias de la vida/Ciencias agrarias/Agricultura, economía y política </dc:subject>
   <dc:subject>[SDV:SA:STA] Ciencias de la vida/Ciencias agrícolas/Ciencias y técnicas de la agricultura</dc:subject>
   <dc:subject>regulación</dc:subject>
   <dc:subject>coordinación</dc:subject>
   <dc:subject>OGM</dc:subject>
   <dc:subject>biotecnología</dc:subject>
   <dc:subject>precio de la semilla</dc:subject>
   <dc:subject>investigación</dc:subject>
   <dc:subject>resistencia a las malas hierbas</dc:subject>
   <dc:subject>cambio complejo de plagas</dc:subject>
   <dc:description>La regulación ex ante del uso de cultivos transgénicos generalmente prevalece, antes de la autorización de liberación comercial Este tipo de regulación aborda las preocupaciones de bioseguridad y coexistencia, bajo la presión de los pros y/o contras de los OMG. Tras quince años de uso a gran escala de cultivos transgénicos (principalmente soja y algodón) en varios países (EE.UU., China, Brasil, India...), se observan fenómenos ecológicos y económicos que podrían amenazar el uso sostenible de variedades transgénicas. Defiendo que el alcance de la regulación debe ampliarse para a) promover un enfoque sistémico y coordinado del uso de cultivos transgénicos, b) garantizar la pureza de la semilla con respecto al rasgo transgénico, c) mantener la investigación sobre variedades no transgénicas, y d) garantizan el precio justo de las semillas transgénicas.</dc:description>
   <dc:coverage>Montpellier</dc:coverage>
   <dc:coverage>Francia</dc:coverage>
   <dc:fecha>2010-08-29</dc:fecha>
   <dc:idioma>inglés</dc:idioma>
   <dc:type>procediendo con la revisión por pares</dc:type>
   <dc:source>Actas de Agro2010, el XI Congreso de la ESA</dc:source>
   <dc:source>Agro2010, el XI Congreso de la ESA</dc:source>
  </oai_dc:dc>
</metadatos>
</registro>

La cosechadora ISIDORE puede utilizar el formato Dublin Core Element Set y los Dublin Core Terms. Puede indexar documentos en esquemas PDF y XML permitiendo la visualización del texto completo (incluyendo TEI o EAD) mejorando así su indexación. El productor de datos debe cuidar de respetar escrupulosamente las especificaciones del protocolo OAI-PMH en su versión 2.0, en particular sobre:

  • Cumplimiento estricto de los valores de “marca de fecha” en los verbos OAI ListIdentifiers y GetRecords para sincronizar mejor las actualizaciones entre el productor e ISIDORE;
  • Gestión adecuada de los datos eliminados (detalle sobre la documentación del protocolo OAI-PMH);
  • En el contexto de almacenes de datos de editores o de gran escala, acceso a su almacén OAI-PMH a través de las direcciones IP de los recolectores OAI-PMH de ISIDORE (reporte de recolección por parte de ISIDORE a su DSI).

Aconsejamos a los productores que validen periódicamente el cumplimiento de su almacén gracias, por ejemplo, a [Open archive tools iniciativa] (https://www.openarchives.org/pmh/tools/). Finalmente, recomendamos a los productores de datos que se comuniquen con el equipo de Huma-Num para cualquier solicitud de información.

¿Cómo reportar tus datos en ISIDORE con metadatos RDFa?

RDFa permite expresar una estructura de metadatos según los principios de la Web Semántica (RDF para Resource Description Framework) en el código HTML de las páginas web . La “a” en RDFa significa “en atributos”, es decir, dentro del código HTML).

Cómo expresar los metadatos de una página Web de forma muy sencilla usando la sintaxis RDFa ? Por ejemplo, en una entrada de blog publicada con WordPress. Si él puede haber complementos para hacer esto, la obsolescencia de estos últimos puede dificultar su mantenimiento en el tiempo. Otra solución es implementar RDFa en código. HTML del tema de WordPress que hayamos elegido. para hacerlo fácil y manejable en el tiempo, la forma más fácil es usar el encabezado HTML <head> para colocar etiquetas <meta> que contendrán algunos metadatos.

Expresar metadatos de acuerdo con el modelo RDF a través de la sintaxis RDFa permite máquinas (principalmente motores de búsqueda e indexadores) para procesar mejor la información porque se vuelve más explícita: para una máquina, una cadena de caracteres puede ser un título o un resumen, si no le dices que es un título o es un resumen no adivinará Como mínimo, es por lo tanto posible utilizar el Etiquetas <meta> para definir una estructura RDF que ofrece la posibilidad para estructurar los metadatos mínimos, por ejemplo con el vocabulario documental Dublin Core Element Set.

¿Cómo hacerlo en la práctica?

Primero, debe indicar en el DOCTYPE de la página web, que será contienen información que utilizará el modelo RDF, por lo que el DOCTYPE será:

<!DOCTYPE html PÚBLICO "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">

En la etiqueta <html>, las direcciones de los ontología documental (a través de su NameSpace XML) que sirven para “escribir” la información. RDFa, que coloca metadatos en la Web Semántica, requiere al menos el uso de ontologías RDF y RDF Schema y Dublin Core Element Set (dc). Es posible utilizar además, para refinar los metadatos, los términos Dublin Core (dcterms):

<html xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/">

Es posible codificar más información, utilizar más de ontologías documentales:

<html
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:skos="http://www.w3.org/2004/02/skos/core#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:xsd="http://www.w3.org/2001/XMLSchema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:cc="http://creativecommons.org/ns#">

En el ejemplo anterior, foaf se usa para codificar información sobre una persona u objeto descrito por los metadatos. La ontología CC te permite indicar qué licencia, de Creative Commons, se aplicaría a este contenido.

La estructura RDFa a través de etiquetas <meta> en el encabezado <head> de la página HTML. Inicialmente tiempo, usando una etiqueta <span> (con foaf), definiremos el objeto digital al que se adjuntará la información codificada en RDF:

<span typeof="foaf:page" about="URL of the page">

Por lo tanto, esta etiqueta define un contenedor para la información que indicará el uso de las etiquetas <meta>. este contenedor es identificado por un URI que resulta ser una URL, es decir la dirección de la página web.

Las etiquetas <meta> luego definen un conjunto de metadatos, que en nuestro caso es información descriptiva sobre la página web de la publicación del blog:

<span typeof="foaf:page" about="URL of the page">
    <meta property="dc:title" content="The title of my post"/>
    <meta property="dc:creator" content="First name Last name of author 1" />
    <meta property="dc:creator" content="First name Last name of author 2" />
    <meta property="dcterms:created" content="2011-01-27" />
    <meta property="dcterms:abstract" content="Un résumé en français" xml:lang="fre" />
    <meta property="dcterms:abstract" content="Una palabra en castillano" xml:lang="es" />
    <meta property="dc:subject" content="keyword A" />
    <meta property="dc:subject" content="keyword B" />
    <meta property="dc:subject" content="keyword C" />
    <meta property="dc:type" content="Web page" />
    <meta property="dc:licence" content="Licence" />
    <meta property="dc:format" content="text/html" />
    <meta property="dc:relation" content="A link to a complementary web page" />
</span>

Dependiendo de la naturaleza del contenido de la página web, por supuesto es posible ser más precisos, más finos y más completos en la información codificado. Por ejemplo, será conveniente utilizar el vocabulario DC TERMS.

DCTERMS permiten, por ejemplo, incluir un formulario preciso para una referencia bibliográfica del contenido:

<meta property="dcterms:bibliographicCitation" content="Pon una cita bibliográfica aquí" />

Sería posible pasar el texto completo de una página web usando el vocabulario SIOC usando la propiedad sioc:content.

También es posible vincular páginas Web entre sí (por definir un corpus de autores por ejemplo) usando en el Vocabulario de DCTERMS Propiedad de DCTERMS: dcterms:isPartOf.

<meta property="dcterms:isPartOf" content="URL de otra página web" />

Creación del mapa del sitio

Una vez que se realiza la codificación RDFa en las páginas HTML, aún debe crear un archivo XML de tipo Sitemap que enumera las páginas que desea que ISIDORE recopile y envíe la URL de este mapa del sitio:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://monsiteweb.com/</loc>
        <lastmod>2018-01-01</lastmod>
        <changefreq>monthly</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>http://monsiteweb.com/page1/</loc>
        <lastmod>2018-03-05</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.5</priority>
  </url>
</urlset>

Es posible probar la extracción que ISIDORE hará de su Metadatos RDFa utilizando la aplicación “ISIDORE on demand” disponible en https://rd.isidore.science/ondemand/fr/rdfa.html

Recolección por OAI para Content Management System (CMS)

¿ISIDORE puede referenciar un sitio web que utilice Omeka Classic y Omeka-S?

Sí, Omeka Classic y Omeka S ofrecen módulos para exponer metadatos según el protocolo OAI-PMH:

¿ISIDORE puede referenciar un sitio web que usa WordPress?

Sí, hay varios módulos de WordPress para mostrar contenido en WordPress en OAI-PMH. Sin embargo, una implementación en Sitemap+RDFa permite trabajar una exposición más fina en los niveles científico y documental de los contenidos y metadatos y además no serdepende de la obsolescencia de los módulos de WordPress.

¿ISIDORE puede referenciar un sitio web que usa Drupal?

Sí, es posible tener páginas Web generadas por el índice ISIDORE por el Drupal CMS. Hay dos formas de hacerlo, dependiendo de la naturaleza del contenido de sus páginas:

  • Ya sea a través del protocolo OAI-PMH y en este caso hay varios módulos para Drupal, ver en https://www.drupal.org/search/site/OAI-PMH.
  • O mediante el uso de una estructura de metadatos en Dublín Core en Drupal generó páginas web usando RDFa y un mapa del sitio.xml. Un artículo dedicado a esta forma de proceder es disponible en la dirección anterior.

Perímetro de ISIDORE

¿Por qué no se encuentran algunos artículos en ISIDORE?

Si no encuentras toda tu producción científica en ISIDORE, puede haber varios explicaciones Sus artículos pueden ser publicados en revistas. que no sean electrónicos o que no hagan su artículos incluso mucho después de haber sido publicados. En efecto, desde su creación, ISIDORE promueve la apertura acceso: la indexación es mejor para los artículos disponibles en acceso libre. Muchas revistas electrónicas han hecho esta elección. a través de portales como Open Edition Journal (anteriormente Revues.org), Érudit, Persée y Cairn.info, Redalyc, OApen y artículos de por lo tanto, estas revistas son recopiladas e indexadas por ISIDORE.

Sus artículos también pueden publicarse en línea, pero no en una plataforma de publicación electrónica (pero un sitio web), o en un plataforma de publicación electrónica que no permite la indexación a través de la protocolo estándar (ver la pregunta y respuesta en el OAI-PMH).

Otras revistas publican sus artículos, pero sólo después de un período de embargo. En este caso, ISIDORE solo indexa metadatos del artículo Si te conectas a través de tu biblioteca universidad, centro de documentación o por BibCNRS, es posible que todavía tiene acceso a estos artículos.

Es posible buscar en colecciones indexadas por ISIDORE utilizando el propio motor y indicando que desea buscar las colecciones.

Su artículo también puede publicarse como una imagen PDF, en este caso sólo la referencia por ISIDORE estará permitido, pero no su indexación de texto completo.

Finalmente, algunos de sus artículos pueden ser publicados en revistas que no están clasificadas en SHS.

En todos estos casos, usted mismo puede depositar sus artículos en un archivo abierto como HAL (HAL-SHS en particular) que también está indexado por ISIDORE o acércate a tu bu/centro de documentación.

Si no te encuentras en ninguno de estos casos y por tanto piensas que es un error, puede enviarnos un correo electrónico a isidore@huma-num.fr.

¿Por qué algunos libros/capítulos de libros no aparecen en ISIDORE?

ISIDORE sabe identificar que un documento es del tipo “obra”, por lo que no tiene más de 500,000 libros y capítulos de libros reportados en ISIDORE.

Debes saber que existen relativamente pocas plataformas de publicación libros en línea de acceso abierto. Índices ISIDORE en SHS, por ejemplo, el contenidos de plataformas de trabajo como:

Además, puede, de acuerdo con su editor, enviar su libro o capítulos de libro en el archivo abierto HAL-SHS. Luego será indexado por ISIDORE en el contexto de la indexación HAL-SHS y reconocido como capítulo de libro.

¿Por qué algunas bases de datos no se reportan en ISIDORE?

La recolección por parte de ISIDORE requiere la exposición de metadatos estandarizados y normalizados (documentales, científicos, etc.) (ya sea usando el protocolo OAI-PMH o usando un Sitemap XML y metadatos RDFa, ver arriba).

Si conoces bases de datos que no están presentes en ISIDORE, no dudes en comunicárnoslas para que podamos ver con sus editores/productores de datos.

Formación en ISIDORE

Listamos aquí los cursos de formación, presentaciones funcionales y autoformación online en el uso de ISIDORE. No dudes en comunicarnos cualquier formación que organices:

Actualizaciones de ISIDORE

Las actualizaciones de ISIDORE y las notas de revisión están disponibles en el sitio web https://isidore.science/releases.