Hébergement Web mutualisé : Linux, Apache, MySQL/PostgreSQL, PHP, Java¶
Huma-Num met à disposition des projets de recherche en SHS un hébergement web mutualisé pour des applications web qui exposent des données de recherche. Le recours à cet hébergement nécessite un suivi constant de l’équipe projet sur le long terme et une autonomie technique sur l’installation et la maintenance de l’applicatif installé. Aucun frais n’est répercuté aux équipes pour le recours à ce service.
Pour demander l’accès à ce service, contactez par e-mail l’équipe Huma-Num en exposant le contexte de votre projet (institutionnel, données, technologique) : cogrid@huma-num.fr. L’équipe d’Huma-Num prend soin d’analyser les demandes de manière collégiale sur les aspects scientifiques, institutionnels, documentaires, informatiques afin d’apporter une réponse adaptée à vos besoins tout en permettant de rationaliser et de mutualiser les moyens mis en œuvre.
Selon la nature de la demande le temps de réponse peut varier entre quelques jours et quelques semaines. La mise à disposition de l’hébergement web est ensuite effectuée dans les meilleurs délais selon la charge de travail de l’équipe.
À savoir
Les demandes d’hébergement de sites web de communication sur des projets de recherche (ANR, etc.) sont orientées vers le service adapté d’hebergement de carnets de recherche mis à disposition par l’Infrastructure OpenEdition : hypotheses.org
Informations générales¶
Conditions Générales d’Utilisation (CGU)¶
Voir dans cette documentation, les CGU.
Référence à Huma-Num et obligation de publicité¶
Vous êtes invités à mentionner sur la page d’accueil de votre site Web le fait que vous êtes hébergé par l’IR* Huma-Num. Vous trouverez un choix d’images sur www.huma-num.fr/supports-communication/.
Annuaire des sites hébergés¶
Un annuaire des sites Web est consultable sur www.huma-num.fr/annuaire-des-sites-web.
Chaque gestionnaire de site est invité à demander l’inscription et la modification de son site dans cet annuaire.
À savoir
L’inscription dans cet annuaire ne vaut pas référencement des pages du site Web dans ISIDORE.
Interopérabilité et signalement des données SHS hébergées dans un site Web¶
Il est rappelé qu’un des critères essentiels d’hébergement de données ou métadonnées dans un site Web sur l’infrastructure Huma-Num est la mise en place d’une politique de signalement et d’interopérabilité de ces dernières, afin qu’elles soient signalées dans notre moteur de recherche et outil de découverte ISIDORE, mais aussi sur Google, etc.
Concernant l’hébergement de données (au sens de fichiers organisés en corpus documentés) dans un site Web, nous vous encourageons à adopter les bonnes pratiques en terme de :
- formats des fichiers acceptés sur le Web ;
- documentation sur les données, sous la forme de métadonnées accessibles aux moteurs de recherche. Cela induit la mise en œuvre de dispositif de signalement et de découvrabilité des données (OAI-PMH, sitemap+RDFa, etc.) ;
- pérennité de l’accès aux données (mise en place d’identifiants pérennes de type DOI, Handle, ARK ou autres)
Ainsi, nous vous encourageons à utiliser NAKALA pour stocker, documenter scientifiquement et publier et signaler vos données et métadonnées, car il permet le respect des items ci-dessus et sa pérennité est prise en charge par l’équipe d’Huma-Num. Il est tout à fait possible de construire des sites Web (avec Omeka Classic et S, WordPress, Drupal, etc.) « au dessus » des données documentées dans NAKALA.
Il est tout à fait possible d’utiliser d’autres dispositifs (Omeka, etc.) mais leurs mises à jour sur le moyen et long terme vous incombe (vous, votre équipe, ou votre prestataire, ainsi, nous vous conseillons de prévoir dans le(s) contrat(s) que vous passer avec des prestataires de services en edition de sites Web).
Le signalement de vos données dans un site Web nécessite la mise en place d’une politique de signalement et d’indexation de vos pages Web et données à votre niveau (projet, équipe de recherche, etc.) et elle doit s’appuyer sur une maintenance de long terme de vos métadonnées dans le cycle de vie que vous leurs données sur le Web et donc au travers des outils de publication Web que vous utilisez.
Le signalement s’appuye sur des protocoles d’interopérabilités (OAI-PMH, Sitemap, micro-format, etc.). Certains outils de publication Web en propose, d’autres non.
Du point de vue des principaux outils de publication de sites Web utilisés en SHS :
OAI-PMH | Sitemap+RDFa | Sitemap+Microdata | RSS 1.0 | RSS 2.0 | API dédiée | |
---|---|---|---|---|---|---|
Omeka Classic | Oui | Oui | Oui | Non | Oui | Oui (activable) |
Omeka S | Oui | Oui (possible) | Oui | Non | Oui | Oui |
Drupal | Possible (modules, complexes à maintenir dans le temps) | Oui (possible) | Oui | Oui | Oui | Oui |
WordPress | Possible (modules, complexes à maintenir dans le temps) | Oui (possible) | Oui | Oui | Oui | Partiellement |
Heurist | Non | Non | Non | Non | Non | Pour l’export |
NAKALA Press | Oui | Oui (en cours de déployement) | Oui | Oui | Oui | Oui |
Collections HAL | Oui | Non | Non | Non | Non | Oui |
Collections Dataverse | Oui | Non | Non | Non | Oui | Oui |
Du point de vue des moteurs de recherche pouvant indexer vos sites Web * :
ISIDORE | ||
---|---|---|
Omeka Classic | Oui (OAI-PMH) | Oui (Sitemap+Microdata) |
Omeka S | Oui (OAI-PMH) | Oui (Sitemap+Microdata) |
Drupal | Oui (OAI-PMH ou Sitemap/RDFa) | Oui (Sitemap+Microdata) |
WordPress | Oui (OAI-PMH ou Sitemap+RDFa) | Oui (Sitemap+Microdata) |
Heurist | Non | Oui (Sitemap+indexation des pages Web accessible ** ) |
NAKALA Press | Oui (OAI-PMH ou Sitemap+Microdata) | Oui (Sitemap+Microdata, en cours de déployement) |
Collections MédiHAL | Oui (OAI-PMH) | Oui (Sitemap-Microdata) |
Collections Dataverse | Oui (OAI-PMH) | Oui (Sitemap+Microdata ou OAI-PMH) |
* Propositions indicatives nécessitant toutes une maintenance à moyen et long terme.
** Les pages Web derrières des formulaires de recherche, de connexion, ne peuvent par être indexé par Google.
La gestion du signalement se fait via plusieurs outils :
- ISIDORE : en contactant l’équipe d’Huma-Num ;
- Google : en utilisant la Google Console.
De tous les protocoles OAI-PMH : Open Archives Initiative Protocol for Metadata Harvesting permet, outre le signalement et le référencement de vos données, pages Web, etc. dans ISIDORE en outre un moissonnage par d’autres institutions (Gallica, Europeana, Base, Google, etc.) ou par d’autres portails web disciplinaires. Il s’agit du protocole d’interopérabilité le plus répandu actuellement dans le domaine des données en SHS et patrimoniale.
Concernant ISIDORE, nous vous proposons un guide d’implémentation complet des méthodes de moissonnage par ISIDORE.
Les demandes de moissonnage ou d’aide pour sa mise en place sont à adresser à isidore-sources@huma-num.fr.
Informations fonctionnelles et technique¶
Ce que l’IR* Huma-Num ne fait pas¶
Le développement ou la configuration d’applications web pour les projets¶
Un élément important est à noter : l’équipe de l’IR* Huma-Num ne peut se substituer aux gestionnaires des sites pour développer, maintenir des applications développées dans les équipes de recherche (ou par des prestataires de services). Nous ne développons pas de logiciels propres pour les programmes de recherche.
Ainsi, les équipes de recherche qui n’ont pas d’informaticien (développeurs, etc.) sont invitées à utiliser nos solutions “clés en main” : NAKALA, NAKALA-PRESS, ISIDORE ou bien sûr à constituer des programmes de recherche embarquant des développeurs.
L’attribution d’identifiants pérennes pour les projets hébergés¶
Enfin, le service d’hébergement web n’inclut pas la mise à disposition d’attribution d’identifiant pérenne (DOI par exemple). L’attribution d’identifiants pérenne est proposée dans l’entrepôt de données NAKALA. Le cas échéant, les projets peuvent prendre contact avec l’INIST l’organisme français chargé de l’attribution de DOI issus de Datacite.
Ce que le gestionnaire du site doit faire : l’engagement de mise à jour¶
Chaque gestionnaire de site porte la responsabilité de réaliser, durant toute la vie du site, y compris après la fin des financements du projet, la mise à jour continue des briques applicatives qu’il aura installées.
Ainsi une mise à jour très rapide des outils d’édition Web dit CMS (Content Management System) les plus courants tels que Wordpress, Drupal, Joomla, SPIP, devra impérativement être réalisée à chaque publication d’une nouvelle version ou d’un avis de sécurité de la part d’Huma-Num.
En paralèlle des outils dit CMS, il existe des dispositifs de publication Web dit “statiques” qui permettent de réduire la maintenance de long terme sur des sites Web liés à des projets d’édition ou de recherche ayant une fin programmée dans le temps. Le principe général est d’utiliser un logiciel permettant de générer un site Web formé de pages HTML et de feuilles de styles CSS statiques et donc qui ne dépend pas de bases de données et languages de script (PHP, etc.) exécutés sur le serveur. La génération du site Web peut se faire sur le poste de travail du chercheur (il existe de normbreux outils dit “locaux”) ou en ligne à l’aide d’outil dit “moteur de publication” tel que par exemple GitLab. Le HN Lab travaille sur ces questions dans le cadre de ses programmes de recherche. Pour plus d’information, voir :
- Exemple de “déplateformisation” d’une revue académique, par Servanne Monjour, MCF, Paris Panthéon-Sorbonne (résidente 2022-2023 au HN Lab) ;
- Création d’un site Web statique compatible avec ISIDORE avec l’intégration continue de GitLab Pages.
Ces outils sont bien sur compatible avec des outils de statistiques Web, tel que matomo.
Serveurs supportant l’hébergement Web mutualisé¶
Nos serveurs sont sous le système d’exploitation CentOS 7. L’accès se fait par un seul serveur interactif par accès selon le protocole SSH et SFTP (pour le transfert de fichiers).
Les serveurs Web, d’applications et de bases de données ne vous sont pas accessibles de manière interactive. Mais votre dossier principal (“home directory”) est le même entre tous les serveurs concernés. Aussi vous avez la vue et la main sur l’ensemble de vos fichiers Web.
Langages, logiciels et applications disponibles¶
Les langages et logiciels mis en œuvre dans le cadre de l’hébergement Web mutualisé :
- Langage de programmation orienté Web : PHP (voir le détail ci-dessous)
- Logiciels de bases de données relationnelles : MySQL, PostgreSQL (Extension PostGIS)
- Logiciels et bases de données XML : BaseX, eXist
- Serveur d’applications : Tomcat
- Technologie de moteur de recherche : SolR
Ainsi une grande partie des applications Web couramment utilisées sont hébergeables sur ce service.
Langage de programmation PHP¶
La version 8.2 de PHP est proposée par défaut. Un fichier contenant <?php phpinfo(); ?>
vous permet de voir la version utilisée par votre site et les modules disponibles.
Le fichier resource/wrapper/php82/php.ini
est lu spécifiquement pour votre site Web. Vous pouvez le modifier si besoin pour modifier des paramètres PHP.
Serveurs MySQL et PostgreSQL¶
Le serveur MySQL en version 8 et se nomme mysql80a.db.huma-num.fr
.
Le serveur PostgreSQL 15 et se nomme postgresql15.db.huma-num.fr
.
Sur ces 2 instances, le mode SSL est activé.
Une interface de gestion de vos bases de donnée MySQL est disponible à l’aide du logiciel en ligne PHPMyAdmin et accessible à l’adresse mygrid.huma-num.fr/tools/myadmin_v4/.
Applications Java¶
Il est possible d’ajouter une application basée sur un serveur d’applications Java à son site HTML ou PHP. Cependant, il convient de demander à l’équipe d’Huma-Num de réaliser l’installation de cette application.
L’application se trouvera en resource/<application>/current
où application
peut donc valoir tomcat
, exist
, elasticsearch
, solr
, basex
ou virtuoso
.
Pour passer un ordre à cette application, il convient :
- d’écrire l’ordre dans le fichier texte nommé
resource/order/<application>
où l’ordre peut valoirstop
,start
,restart
,kill
,forcekill
,top
; - et d’attendre maximum 3 minutes pour voir le résultat dans
resource/order/<application>.out
Envoi de messages électroniques¶
Vous disposez d’un serveur SMTP permettant l’envoi de messages à l’adresse relay.huma-num.fr
(ceci sans chiffrement, sans authentification et sur le port 25 traditionnel).
Journaux (logs)¶
Les journaux Apache sont stockés jour par jour et conservés pendant un an dans votre dossier www/log
.
Statistiques Web¶
Nous proposons un service complet de statistiques Web (analyse des consultations Web via traceur) utilisant l’outil Matomo.
Forge logicielle¶
Nous proposons également un service de force logicielle avec l’outil GitLab permettant d’héberger des codes informatique pour des projets de développement. Il est accessible sur gitlab.huma-num.fr. Il convient d’en demander l’accès depuis votre compte humanid.huma-num.fr.
Une documentation dédiée sur l’instance de GitLab d’Huma-Num est disponible.
Sauvegardes¶
Une sauvegarde incrémentale de l’ensemble de vos fichiers et de vos bases de données est effectuée chaque nuit.
Vous avez un accès direct aux “snapshots” (photos instantanées) prises par le serveur de fichiers à intervalle régulier. La commande suivante vous permet de lister les dates des snapshots disponibles :
ls -l .snapshot
Vous pouvez ensuite parcourir ces dossiers de manière usuelle, pour récupérer un fichier ou un dossier dans leur version précédente.
Support¶
Toute demande concernant ce service doit impérativement être envoyée à l’adresse assistance@huma-num.fr
Machine virtuelle¶
Dans le cas où :
- vous avez des bonnes raisons de penser que des limitations techniques existent sur cet hébergement Web mutualisé ;
- ou si vous souhaitez plus d’autonomie de gestion technique tout en pouvant assumer l’administration système d’un système Linux.
nous pouvons mettre à disposition une machine virtuelle dans laquelle vous disposez du droit d’administration. Les machine virtuelle nécessitent une bonne connaissance en système Linux afin d’opérer en ligne de commande les mises à jour nécessaires. Rendez-vous sur la documentation des machines virtuelles pour plus d’information.