Huma-Num en una palabra

Huma-Num es una Gran Infraestructura de Investigación (“Très Grande Infrastructure de Recherche”, TGIR) francesa dedicada a las Humanidades y a las Ciencias Sociales (HCS) con alcance internacional. Forma parte del  CNRS (Centro Nacional para la Investigación Científica de Francia) y también recibe apoyo de la Universidad de Aix-Marseille y del Campus Condorcet.  Es parte de la hoja de ruta nacional ESFRI, que a su vez está alineada con la de la Unión Europea. De hecho, a Huma-Num se le ha confiado la coordinación de la participación de Francia en dos ERIC (Consorcio para una Infraestructura de Investigación Europea): DARIAH (Infraestructura Digital para la Investigación en las Artes y Humanidades) y CLARIN (Infraestructura de Recursos y Tecnologías de Lenguas Comunes). También está involucrada en proyectos europeos e internacionales.

Huma-Num tiene como objetivo apoyar a las comunidades de investigación en HCS mediante el suministro de servicios, herramientas y compartiendo su experiencia sobre datos digitales para la investigación. Para realizar sus misiones, la TGIR Huma-Num funda sus actividades en una organización innovadora que combina recursos humanos (concertación colectiva a través de los consorcios de Huma-Num, que son grupos de investigadores e ingenieros, financiados por Huma-Num, que trabajan en áreas comunes de interés) y tecnológicos (servicios digitales perennes, ver más abajo) a escala nacional y europea.

Con los consorcios que apoya y patrocina, Huma-Num coordina la producción de datos digitales y ofrece un conjunto de plataformas y herramientas para procesar, almacenar, difundir y archivar a largo plazo los datos digitales para la investigación. Uno de los objetivos científicos de este esfuerzo es promover el compartir los datos de investigación y el conocimiento científico en general para que otros investigadores, comunidades o disciplinas puedan reutilizarlos, incluso en una perspectiva interdisciplinaria y de diferentes maneras. De manera más general, los principios y métodos de la Web de datos (RDF, SPARQL, SKOS, OWL) en los que se basan los servicios de Huma-Num permiten documentar o volver a documentar los datos para diversos usos sin confinarlos en silos inaccesibles.

En consecuencia, Huma-Num apoya principios y métodos como la ciencia abierta y las tecnologías de la Web de datos, para promover la interoperabilidad tanto internamente para permitir que sus servicios se comuniquen entre sí, como externamente para permitir a los usuarios conectar sus herramientas a los servicios de Huma-Num.

Técnicamente, la infraestructura está alojada en un gran centro de datos en Lyon construido por y para físicos. Huma-Num también colabora con el Centro Informático Nacional de Educación Superior dedicado a la  preservación de datos a largo plazo (CINES) con sede en Montpellier. Además, Huma-Num trabaja con un grupo de correspondientes en la red de MSH (Maison des Sciences de l’Homme, http://www.msh-reseau.fr). Ellos ayudan a transmitir información sobre sus servicios y herramientas.

¿Qué puede hacer Huma-Num por usted?

Huma-Num propone herramientas y servicios, principalmente a comunidades francesas de investigadores e ingenieros en HCS para cada etapa del ciclo de vida de los datos de investigación. También apoya a proyectos de investigación con una gama de herramientas para facilitar la interoperabilidad de varios tipos de datos digitales sin procesar y de metadatos.

Más específicamente para colecciones digitales, el objetivo es fomentar el intercambio y la difusión de metadatos, pero también de datos a través de herramientas estandarizadas y formatos abiertos y perennes. Todas las herramientas elaboradas por Huma-Num se basan en las tecnologías de la Web de datos, principalmente por sus características autodescriptivas y por las oportunidades de enriquecimiento que ofrecen. Otras tecnologías de interoperabilidad complementan esas herramientas, como el protocolo OAI-PMH. Todos nuestros recursos son, por lo tanto, totalmente compatibles con Linked Open Data (LOD).   Huma-Num desarrolló tres servicios en particular para procesar, almacenar y exponer datos de investigación mientras los hace FAIR (Hallables, Accesibles, Interoperables, Reusables) y los prepara para su reutilización y preservación a largo plazo. Estos servicios abarcan el ciclo de vida de los datos de investigación y están diseñados para satisfacer las necesidades derivadas de estos:

  • compartir con NAKALA;
  • exponer con NAKALONA;
  • señalar con ISIDORE.

Estos servicios complementarios constituyen, por lo tanto, una cadena coherente de herramientas para los datos de investigación. Mientras interactúan sin problemas entre sí, también están abiertos a herramientas externas que utilizan las mismas tecnologías.

NAKALA (https://www.nakala.fr/)

NAKALA es un servicio interoperable y seguro para depositar todo tipo de datos (archivos de texto, audio, vídeo, imágenes) con el fin de compartirlos. Basado en las tecnologías de la Web de datos, este repositorio proporciona principalmente tres tipos de servicios:

  • atribución de un PID (Persistent IDentifier) que hace que los datos y metadatos sean citables;
  • acceso permanente a los datos;
  • difusión de metadatos a través de una triplestore y OAI-PMH.

Esto permite separar la administración de los datos de su exposición.

NAKALONA (https://www.nakalona.fr/)

NAKALONA es un programa que asocia el sistema de gestión de contenidos Omeka (creado por el Roy Rosenzweig, Center for History and New Media, Universidad George Mason, Virginia, EE. UU.) y NAKALA, un servicio creado por Huma-Num.

Combina la potencia de Omeka para editar y exponer datos digitales y las características del repositorio de NAKALA para compartir datos y metadatos de una manera interoperable. El principal objetivo de NAKALONA es ofrecer la posibilidad de compartir y mostrar los datos y metadatos ya almacenados dentro de NAKALA, aprovechando al mismo tiempo las posibilidades de Omeka, como su potente motor de búsqueda y el sistema de alimentación de datos OAI-PMH.

Este programa está completamente administrado por el equipo de Huma-Num, y se proporciona como un Software como un Servicio (ScuS).

ISIDORE (https://www.rechercheisidore.fr/)

ISIDORE es un buscador que permite acceder a mas de 6 milliones de datos digitales de Humanidades y Ciencias Sociales. Abierto a todos, se apoya en los principios de la Web de datos y proporciona acceso libre a los datos (acceso abierto). Más que una simple interfaz de búsqueda, ISIDORE normaliza y enriquece los metadatos y los datos colectados gracias a referenciales en tres idiomas (francés, inglés y español).

Servicios de almacenamiento

Uno de los objetivos de Huma-Num, al proponer servicios de almacenamiento, es evitar la pérdida de datos mediante la preparación de su preservación a largo plazo. Huma-Num destaca dos aspectos:

  • Documentar el uso de formatos apropiados, que son la base de la interoperabilidad de los datos, lo que facilita ampliamente el proceso de archivo.
  • Hacer que el almacenamiento de los datos sea independiente del dispositivo utilizado para diseminarlos.

Se proporcionan diferentes tecnologías para datos fríos (es decir, datos inactivos que rara vez se usan o acceden), datos tibios (es decir, datos que se analizan de manera bastante frecuente, pero que no están constantemente “en movimiento”) y datos calientes (es decir, datos utilizados con mucha frecuencia y datos que los administradores perciben que están cambiando constantemente).

Para datos fríos: Copia de seguridad en cintas

Para los datos fríos, el centro de datos CC-IN2P3 que alberga la infraestructura de Huma-Num proporciona una copia de seguridad en cintas (actualmente alrededor de 700 Tos).

Para datos tibios: un sistema NAS

Para los datos tibios, un NAS asociado con imágenes regulares proporciona una alta disponibilidad (actualmente alrededor de 100 Tos).

Para datos calientes: el sistema distribuido Huma-Num Box

Huma-Num Box es un sistema de archivos distribuidos para datos calientes. Se ha establecido una malla de almacenamiento distribuido en toda Francia (actualmente 9 nodos) utilizando diferentes tecnologías de almacenamiento encapsuladas. Por lo tanto, es posible realizar copias de seguridad y versiones en cualquier nodo vinculado en esta red lógicamente privada: el programa permite una flexibilidad completa en cuanto al tipo y frecuencia de copias de seguridad y versiones (actualmente alrededor de 300 Tos).

ShareDocs

ShareDocs es un administrador de archivos que se puede usar a través de un navegador web, un cliente WebDAV o un programa de sincronización de archivos. Algunas de sus características son comparables a herramientas de Dropbox o de Google Drive, pero tiene claras ventajas con respecto a la seguridad del almacenamiento de datos.

Preservación a largo plazo

Huma-Num brinda un servicio de preservación a largo plazo basado en el servicio del CINES (https://www.cines.fr/en/long-term-preservation/), que está destinado a datos que tienen alto valor patrimonial y/o que tiene un valor científico específico. Esto es mucho más que la preservación de bits realizada con las tecnologías mencionadas anteriormente. Un proyecto de preservación a largo plazo significa que los datos deben estar organizados de tal manera que puedan ser reutilizados por alguien que no participó en su creación, lo que presupone mucha curación. Además, los datos deben ser expresados ​​en un formato aceptado por el CINES (ver https://facile.cines.fr) y es necesario proporcionar información adicional para documentar el contexto de producción de datos, metadatos, etc. Huma-Num acompaña ese tipo de proyectos con un papel de intermediario entre productores de datos, el CINES, los archivistas y otros actores.

Suministro de programas

Huma-Num también compra licencias y puede proporcionar acceso por encargo a programas comerciales para el procesamiento de texto, imagen o sonido, la gestión de datos espaciales y el análisis de datos como Oxygen, XMLmind XML Editor, Abbyy, R Studio, ArcGIS, etc.

Vea la lista de programas disponibles aquí.

Consorcios de Huma-Num

La idea principal de un consorcio es organizar un diálogo colectivo y (multi)disciplinario dentro de las comunidades de investigación en HCS reuniendo a diferentes tipos de actores (investigadores, personal técnico, bibliotecarios, ingenieros, etc.) provenientes de diferentes instituciones, con el objetivo de crear sinergias. A cambio, se espera un consorcio que proporcione recomendaciones sobre mejores prácticas tecnológicas o científicas, nuevos estándares y herramientas.

¿Qué es un consorcio de Huma-Num? ¿Cuál es su ciclo de vida?

Un consorcio de la TGIR Huma-Num es un grupo de personas, a menudo de diferentes instituciones de investigación, a veces de diferentes disciplinas, que trabajan sobre los mismos objetos, métodos y/o temas científicos. Elaboran juntos un proyecto común, y lo presentan al Consejo Científico de Huma-Num, quienes lo evalúan y, si se aprueba, el consorcio está certificado y financiado por Huma-Num durante cuatro años.

Cada año, el Consejo Científico hace una evaluación científica de sus acciones y da una recomendación sobre el presupuesto solicitado. Luego, la junta directiva de Huma-Num acepta o propone modificaciones al presupuesto y demás.

Cada año, Huma-Num acredita nuevos participantes, recibe presentaciones o renueva acreditaciones basadas en una combinación de continuos y nuevos proyectos del grupo.

¿Cuáles son los objetivos de los consorcios de Huma-Num y qué hacen?

Con la ayuda de los servicios y del personal de Huma-Num, los consorcios de Huma-Num tienen la tarea de crear sinergias entre las comunidades de investigación en HCS. Su principal objetivo es promover la apropiación de herramientas digitales y su incorporación en la dinámica de open data, open source y open access.

Para hacerlo, lideran una variedad de acciones, como organizar una concertación sobre buenas prácticas, organizar sesiones de formación, desarrollar herramientas específicas o genéricas, publicar recomendaciones y promover el diálogo a múltiples escalas.

Vea la lista actual de los consorcios de Huma-Num aquí.

Colaboraciones internacionales de Huma-Num

Huma-Num se implica en diferentes proyectos europeos e internacionales. También colabora con infraestructuras extranjeras en todo el mundo.

ERICs

El CNRS y el Ministerio francés de Educación Superior e Investigación (MENESR) han otorgado a Huma-Num la responsabilidad de manejar la participación francesa en dos ERIC (Consorcio para una Infraestructura de Investigación Europea): Huma-Num es así miembro fundador de DARIAH y actualmente miembro observador en CLARIN.

DARIAH (https://www.dariah.eu/)

El ERIC DARIAH (Digital Research Infrastructure for the Arts and Humanities) es una infraestructura paneuropea para académicos de Artes y Humanidades que trabajan con métodos computacionales. Apoya la investigación digital, así como la enseñanza de métodos de investigación digital. Francia es un miembro oficial.

CLARIN (https://www.clarin.eu/)

El ERIC CLARIN (Common Language Resources and Technology Infrastructure) se encarga de crear y mantener una infraestructura para apoyar tanto el intercambio, el uso y la sostenibilidad de datos de lenguaje que herramientas para la investigación en Humanidades y Ciencias Sociales. Actualmente CLARIN proporciona un acceso fácil y sostenible a datos de lenguaje digitales (en forma escrita, oral o multimodal) para académicos en HCS y más allá. CLARIN también ofrece herramientas avanzadas para descubrir, explorar, explotar, anotar, analizar o combinar esos tipos de conjuntos de datos, donde se encuentren. Francia es actualmente un miembro observador.

OPERAS (https://operas.hypotheses.org/)

OPERAS es una infraestructura de investigación europea para la comunicación académica abierta, particularmente en las Humanidades y Ciencias Sociales. Liderado por la infraestructura francesa OpenEdition, aspira a convertirse en un ERIC y reúne a 35 organizaciones de 12 países europeos. Pretende coordinar y agrupar las actividades de comunicación académica dirigidas por las universidades en Europa a fin de permitir la Ciencia Abierta (Open Science) como práctica estándar.

Para lograr este objetivo, orientará las actividades de los actores estratégicos de la comunicación científica y de las partes interesadas (instituciones de investigación, bibliotecas, plataformas, editores, patrocinadores) en su transición a la ciencia abierta. También desarrollará estándares comunes de mejores prácticas para la publicación digital en acceso abierto, las infraestructuras, los servicios, las cualidades editoriales, los modelos comerciales y los flujos de financiación.

H2020

PARTHENOS (2015-2019)

PARTHENOS (http://www.parthenos-project.eu/) significa “Pooling Activities, Resources and Tools for Heritage E-research Networking, Optimization and Synergies”. Este proyecto H2020 tiene como objetivo reforzar la cohesión de la investigación en el amplio sector de los Estudios Lingüísticos, de las Humanidades, del Patrimonio Cultural, de las Ciencias Sociales y en los campos relacionados a través de un grupo temático de 16 Infraestructuras de Investigación Europeas. El proyecto también aspira a integrar iniciativas, e-infraestructuras y otras infraestructuras de clase mundial y a la construcción de puentes entre áreas diferentes, aunque estrechamente relacionadas.

PARTHENOS alcanzará esos objetivos mediante la definición y el apoyo de normas comunes, la coordinación de actividades conjuntas, la armonización de la definición e implementación de políticas y el desarrollo de servicios, de herramientas y de soluciones compartidos.

Humanities at Scale (2015-2017)

El proyecto Humanities at Scale (http://has.dariah.eu/) fue diseñado para mejorar el ERIC DARIAH en el fomento de nuevos conocimientos y en el mantenimiento de los existentes en la investigación digital en Artes y Humanidades. Para alcanzar estos objetivos, HaS se centró en tres actividades principales: ampliar la comunidad DARIAH promoviendo prácticas comunes y expandiendo el conocimiento sobre Humanidades Digitales con un programa paneuropeo,  incluso en regiones sin una larga tradición en Humanidades Digitales, desarrollar servicios básicos para el ERIC, e informar a las comunidades de investigación.

Otras colaboraciones internacionales

Canadá

Huma-Num es socio de la iniciativa canadiense CO.SHS, la ciberinfraestructura abierta para las Humanidades y las Ciencias Sociales, para la cual proporciona expertos y herramientas. CO.SHS está fortaleciendo la capacidad de producción de publicaciones académicas digitales, aumentando el apoyo para la investigación en Humanidades y Ciencias Sociales a través del descubrimiento de resultados de investigación difundidos en la plataforma Erudit, y facilitando la exploración de vastos corpus textuales con herramientas de análisis y visualización.

Lea más sobre CO.SHS: https://co-shs.ca/en/about/ y https://co-shs.ca/en/partners/

Mundo de habla hispana

Desde 2010, ISIDORE, el buscador en HCS creado por Huma-Num, es multilingüe y anota documentos en tres idiomas: francés, inglés y español.

Para fomentar estas funcionalidades y contribuir a sostener los principios de la ciencia abierta promoviendo el intercambio de conocimiento, Huma-Num emprendió en 2018 la tarea de recopilar documentos en español de universidades o infraestructuras latinoamericanas que tenían repositorios con datos de HCS listos para ser cosechados por ISIDORE.

De momento, más de 10,000 documentos adicionales en español han sido agregados a ISIDORE, enriquecidos y valorados, y ahora se encuentran disponibles para nuevas investigaciones.

La TGIR Huma-Num continuará este trabajo con el apoyo de las redes universitarias francesas existentes (red UMIFRE, IFAL, IRD, CEMCA) además de los socios locales con miras a una colaboración más estrecha.