Hébergement Web mutualisé : Linux, Apache, MySQL/PostgreSQL, PHP, Java

Huma-Num met à disposition des projets de recherche en SHS un hébergement web mutualisé pour des applications web qui exposent des données de recherche. Le recours à cet hébergement nécessite un suivi constant de l’équipe projet sur le long terme et une autonomie technique sur l’installation et la maintenance de l’applicatif installé. Aucun frais n’est répercuté aux équipes pour le recours à ce service.

Pour demander l’accès à ce service, contactez par e-mail l’équipe Huma-Num en exposant le contexte de votre projet (institutionnel, données, technologique) : cogrid@huma-num.fr. L’équipe d’Huma-Num prend soin d’analyser les demandes de manière collégiale sur les aspects scientifiques, institutionnels, documentaires, informatiques afin d’apporter une réponse adaptée à vos besoins tout en permettant de rationaliser et de mutualiser les moyens mis en œuvre.

Selon la nature de la demande le temps de réponse peut varier entre quelques jours et quelques semaines. La mise à disposition de l’hébergement web est ensuite effectuée dans les meilleurs délais selon la charge de travail de l’équipe.

À savoir

Les demandes d’hébergement de sites web de communication sur des projets de recherche (ANR, etc.) sont orientées vers le service adapté d’hebergement de carnets de recherche mis à disposition par l’Infrastructure OpenEdition : hypotheses.org

Informations générales

Conditions Générales d’Utilisation (CGU)

Voir dans cette documentation, les CGU.

Référence à Huma-Num et obligation de publicité

Vous êtes invités à mentionner sur la page d’accueil de votre site Web le fait que vous êtes hébergé par l’IR* Huma-Num. Vous trouverez un choix d’images sur www.huma-num.fr/supports-communication/.

Annuaire des sites hébergés

Un annuaire des sites Web est consultable sur www.huma-num.fr/annuaire-des-sites-web.

Chaque gestionnaire de site est invité à demander l’inscription et la modification de son site dans cet annuaire.

À savoir

L’inscription dans cet annuaire ne vaut pas référencement des pages du site Web dans ISIDORE.

Interopérabilité et signalement des données SHS hébergées dans un site Web

Il est rappelé qu’un des critères essentiels d’hébergement de données ou métadonnées dans un site Web sur l’infrastructure Huma-Num est la mise en place d’une politique de signalement et d’interopérabilité de ces dernières, afin qu’elles soient signalées dans notre moteur de recherche et outil de découverte ISIDORE, mais aussi sur Google, etc.

Concernant l’hébergement de données (au sens de fichiers organisés en corpus documentés) dans un site Web, nous vous encourageons à adopter les bonnes pratiques en terme de :

  • formats des fichiers acceptés sur le Web ;
  • documentation sur les données, sous la forme de métadonnées accessibles aux moteurs de recherche. Cela induit la mise en œuvre de dispositif de signalement et de découvrabilité des données (OAI-PMH, sitemap+RDFa, etc.) ;
  • pérennité de l’accès aux données (mise en place d’identifiants pérennes de type DOI, Handle, ARK ou autres)

Ainsi, nous vous encourageons à utiliser NAKALA pour stocker, documenter scientifiquement et publier et signaler vos données et métadonnées, car il permet le respect des items ci-dessus et sa pérennité est prise en charge par l’équipe d’Huma-Num. Il est tout à fait possible de construire des sites Web (avec Omeka Classic et S, WordPress, Drupal, etc.) « au dessus » des données documentées dans NAKALA.

Il est tout à fait possible d’utiliser d’autres dispositifs (Omeka, etc.) mais leurs mises à jour sur le moyen et long terme vous incombe (vous, votre équipe, ou votre prestataire, ainsi, nous vous conseillons de prévoir dans le(s) contrat(s) que vous passer avec des prestataires de services en edition de sites Web).

Le signalement de vos données dans un site Web nécessite la mise en place d’une politique de signalement et d’indexation de vos pages Web et données à votre niveau (projet, équipe de recherche, etc.) et elle doit s’appuyer sur une maintenance de long terme de vos métadonnées dans le cycle de vie que vous leurs données sur le Web et donc au travers des outils de publication Web que vous utilisez.

Le signalement s’appuye sur des protocoles d’interopérabilités (OAI-PMH, Sitemap, micro-format, etc.). Certains outils de publication Web en propose, d’autres non.

Du point de vue des principaux outils de publication de sites Web utilisés en SHS :

OAI-PMH Sitemap+RDFa Sitemap+Microdata RSS 1.0 RSS 2.0 API dédiée
Omeka Classic Oui Oui Oui Non Oui Oui (activable)
Omeka S Oui Oui (possible) Oui Non Oui Oui
Drupal Possible (modules, complexes à maintenir dans le temps) Oui (possible) Oui Oui Oui Oui
WordPress Possible (modules, complexes à maintenir dans le temps) Oui (possible) Oui Oui Oui Partiellement
Heurist Non Non Non Non Non Pour l’export
NAKALA Press Oui Oui (en cours de déployement) Oui Oui Oui Oui
Collections HAL Oui Non Non Non Non Oui
Collections Dataverse Oui Non Non Non Oui Oui

Du point de vue des moteurs de recherche pouvant indexer vos sites Web * :

ISIDORE Google
Omeka Classic Oui (OAI-PMH) Oui (Sitemap+Microdata)
Omeka S Oui (OAI-PMH) Oui (Sitemap+Microdata)
Drupal Oui (OAI-PMH ou Sitemap/RDFa) Oui (Sitemap+Microdata)
WordPress Oui (OAI-PMH ou Sitemap+RDFa) Oui (Sitemap+Microdata)
Heurist Non Oui (Sitemap+indexation des pages Web accessible ** )
NAKALA Press Oui (OAI-PMH ou Sitemap+Microdata) Oui (Sitemap+Microdata, en cours de déployement)
Collections MédiHAL Oui (OAI-PMH) Oui (Sitemap-Microdata)
Collections Dataverse Oui (OAI-PMH) Oui (Sitemap+Microdata ou OAI-PMH)

* Propositions indicatives nécessitant toutes une maintenance à moyen et long terme.

** Les pages Web derrières des formulaires de recherche, de connexion, ne peuvent par être indexé par Google.

La gestion du signalement se fait via plusieurs outils :

De tous les protocoles OAI-PMH : Open Archives Initiative Protocol for Metadata Harvesting permet, outre le signalement et le référencement de vos données, pages Web, etc. dans ISIDORE en outre un moissonnage par d’autres institutions (Gallica, Europeana, Base, Google, etc.) ou par d’autres portails web disciplinaires. Il s’agit du protocole d’interopérabilité le plus répandu actuellement dans le domaine des données en SHS et patrimoniale.

Concernant ISIDORE, nous vous proposons un guide d’implémentation complet des méthodes de moissonnage par ISIDORE.

Les demandes de moissonnage ou d’aide pour sa mise en place sont à adresser à isidore-sources@huma-num.fr.

Informations fonctionnelles et technique

Ce que l’IR* Huma-Num ne fait pas

Le développement ou la configuration d’applications web pour les projets

Un élément important est à noter : l’équipe de l’IR* Huma-Num ne peut se substituer aux gestionnaires des sites pour développer, maintenir des applications développées dans les équipes de recherche (ou par des prestataires de services). Nous ne développons pas de logiciels propres pour les programmes de recherche.

Ainsi, les équipes de recherche qui n’ont pas d’informaticien (développeurs, etc.) sont invitées à utiliser nos solutions “clés en main” : NAKALA, NAKALA-PRESS, ISIDORE ou bien sûr à constituer des programmes de recherche embarquant des développeurs.

L’attribution d’identifiants pérennes pour les projets hébergés

Enfin, le service d’hébergement web n’inclut pas la mise à disposition d’attribution d’identifiant pérenne (DOI par exemple). L’attribution d’identifiants pérenne est proposée dans l’entrepôt de données NAKALA. Le cas échéant, les projets peuvent prendre contact avec l’INIST l’organisme français chargé de l’attribution de DOI issus de Datacite.

Ce que le gestionnaire du site doit faire : l’engagement de mise à jour

Chaque gestionnaire de site porte la responsabilité de réaliser, durant toute la vie du site, y compris après la fin des financements du projet, la mise à jour continue des briques applicatives qu’il aura installées.

Ainsi une mise à jour très rapide des outils d’édition Web dit CMS (Content Management System) les plus courants tels que Wordpress, Drupal, Joomla, SPIP, devra impérativement être réalisée à chaque publication d’une nouvelle version ou d’un avis de sécurité de la part d’Huma-Num.

En paralèlle des outils dit CMS, il existe des dispositifs de publication Web dit “statiques” qui permettent de réduire la maintenance de long terme sur des sites Web liés à des projets d’édition ou de recherche ayant une fin programmée dans le temps. Le principe général est d’utiliser un logiciel permettant de générer un site Web formé de pages HTML et de feuilles de styles CSS statiques et donc qui ne dépend pas de bases de données et languages de script (PHP, etc.) exécutés sur le serveur. La génération du site Web peut se faire sur le poste de travail du chercheur (il existe de normbreux outils dit “locaux”) ou en ligne à l’aide d’outil dit “moteur de publication” tel que par exemple GitLab. Le HN Lab travaille sur ces questions dans le cadre de ses programmes de recherche. Pour plus d’information, voir :

Ces outils sont bien sur compatible avec des outils de statistiques Web, tel que matomo.

Serveurs supportant l’hébergement Web mutualisé

Nos serveurs sont sous le système d’exploitation CentOS 7. L’accès se fait par un seul serveur interactif par accès selon le protocole SSH et SFTP (pour le transfert de fichiers).

Les serveurs Web, d’applications et de bases de données ne vous sont pas accessibles de manière interactive. Mais votre dossier principal (“home directory”) est le même entre tous les serveurs concernés. Aussi vous avez la vue et la main sur l’ensemble de vos fichiers Web.

Langages, logiciels et applications disponibles

Les langages et logiciels mis en œuvre dans le cadre de l’hébergement Web mutualisé :

  • Langage de programmation orienté Web : PHP (voir le détail ci-dessous)
  • Logiciels de bases de données relationnelles : MySQL, PostgreSQL (Extension PostGIS)
  • Logiciels et bases de données XML : BaseX, eXist
  • Serveur d’applications : Tomcat
  • Technologie de moteur de recherche : SolR

Ainsi une grande partie des applications Web couramment utilisées sont hébergeables sur ce service.

Langage de programmation PHP

La version 8.2 de PHP est proposée par défaut. Un fichier contenant <?php phpinfo(); ?> vous permet de voir la version utilisée par votre site et les modules disponibles.

Le fichier resource/wrapper/php82/php.ini est lu spécifiquement pour votre site Web. Vous pouvez le modifier si besoin pour modifier des paramètres PHP.

Serveurs MySQL et PostgreSQL

Le serveur MySQL en version 8 et se nomme mysql80a.db.huma-num.fr.

Le serveur PostgreSQL 15 et se nomme postgresql15.db.huma-num.fr.

Sur ces 2 instances, le mode SSL est activé.

Une interface de gestion de vos bases de donnée MySQL est disponible à l’aide du logiciel en ligne PHPMyAdmin et accessible à l’adresse mygrid.huma-num.fr/tools/myadmin_v4/.

Applications Java

Il est possible d’ajouter une application basée sur un serveur d’applications Java à son site HTML ou PHP. Cependant, il convient de demander à l’équipe d’Huma-Num de réaliser l’installation de cette application.

L’application se trouvera en resource/<application>/currentapplication peut donc valoir tomcat, exist, elasticsearch, solr, basex ou virtuoso.

Pour passer un ordre à cette application, il convient :

  • d’écrire l’ordre dans le fichier texte nommé resource/order/<application> où l’ordre peut valoir stop, start, restart, kill, forcekill, top ;
  • et d’attendre maximum 3 minutes pour voir le résultat dans resource/order/<application>.out

Envoi de messages électroniques

Vous disposez d’un serveur SMTP permettant l’envoi de messages à l’adresse relay.huma-num.fr (ceci sans chiffrement, sans authentification et sur le port 25 traditionnel).

Journaux (logs)

Les journaux Apache sont stockés jour par jour et conservés pendant un an dans votre dossier www/log.

Statistiques Web

Nous proposons un service complet de statistiques Web (analyse des consultations Web via traceur) utilisant l’outil Matomo.

Forge logicielle

Nous proposons également un service de force logicielle avec l’outil GitLab permettant d’héberger des codes informatique pour des projets de développement. Il est accessible sur gitlab.huma-num.fr. Il convient d’en demander l’accès depuis votre compte humanid.huma-num.fr.

Une documentation dédiée sur l’instance de GitLab d’Huma-Num est disponible.

Sauvegardes

Une sauvegarde incrémentale de l’ensemble de vos fichiers et de vos bases de données est effectuée chaque nuit.

Vous avez un accès direct aux “snapshots” (photos instantanées) prises par le serveur de fichiers à intervalle régulier. La commande suivante vous permet de lister les dates des snapshots disponibles :

    ls -l .snapshot

Vous pouvez ensuite parcourir ces dossiers de manière usuelle, pour récupérer un fichier ou un dossier dans leur version précédente.

Support

Toute demande concernant ce service doit impérativement être envoyée à l’adresse assistance@huma-num.fr

Machine virtuelle

Dans le cas où :

  • vous avez des bonnes raisons de penser que des limitations techniques existent sur cet hébergement Web mutualisé ;
  • ou si vous souhaitez plus d’autonomie de gestion technique tout en pouvant assumer l’administration système d’un système Linux.

nous pouvons mettre à disposition une machine virtuelle dans laquelle vous disposez du droit d’administration. Les machine virtuelle nécessitent une bonne connaissance en système Linux afin d’opérer en ligne de commande les mises à jour nécessaires. Rendez-vous sur la documentation des machines virtuelles pour plus d’information.