Aller au contenu principal

Web sémantique et thésauri

Web sémantique et thésauri

Missions

Définir et développer une nouvelle infrastructure matérielle et un système d’information dédié au traitement générique de bases de données de catalogage visant à accueillir les réseaux thématiques du CNRS (INSHS), soutenir les programmes, les bibliothèques, les porteurs de projets et les réseaux documentaires thématiques. 

Après 19 ans d'ouverture vers le travail en réseau, la plateforme a développé une collaboration et un partenariat avec un réseau de spécialistes situés un peu partout en France.

La plateforme est rattachée au PSIR (Pôle Système d'Information et Réseau) de la MOM, qui est organisé en pôles de compétence. Chaque responsable de service ou plateforme apporte son savoir-faire dans son domaine pour mieux s'organiser au service de la recherche. Ainsi, la plateforme intervient au sein du PSIR sur des projets communs et transversaux qui correspondent à son domaine de compétence.

La plateforme assure la direction informatique du GDS 3378 (Groupement de Services) FRANTIQ, avec mission de définir une nouvelle chaîne de centralisation et de mutualisation des données, de développer les outils logiciels nécessaires à la gestion de thésaurus, de diffuser et développer l’interopérabilité des notices.

Axes

• Gestion des réseaux et des bases de données documentaires
• Gestion et diffusion des thésaurus multilingues
• Normes RDF, SKOS, UNIMARC, Iso2709
• Développement d’outils informatiques

Valorisations

La plateforme valorise ses actions par des communications dans des journées thématiques ou colloques au niveau national et européen. Ces dernières années, elle a assuré plusieurs présentations :

  • Intervention dans la journée FAIR à Paris le 27/11/2018 à l’amphithéâtre charpak
  • Formation à Opentheso et aux normes des thésaurus pour les équipes d’OpenEdition à Marseille le 11/11/2018 pendant 3 jours
  • Animation de plusieurs ateliers à l’utilisation du logiciel Opentheso pour les consortiums de la TGIR Huma-Num (ENS-Lyon 2018, UDL 2018)
  • Présentation d’Opentheso au SemWebPro 2017 à Paris (journée de présentations et de rencontres dédiées au web sémantique dans le monde professionnel)
  • Co-animation d’un atelier « Indexer avec PACTOLS et contribuer au thésaurus via Opentheso » (MSH-TOURS 2017)
  • Présentation d’Opentheso à l’AG du GDRI « Groupe de Recherche International » Zoomathia (IRHT Paris 2017)
  • Animation d’un atelier au colloque de MASA « Mémoire des Archéologues et des Sites Archéologiques » (Nanterre 2016)
  • Présentation d’Opentheso aux  « lundis numériques » de l’INHA (Paris 2016)
  • Atelier formation et démonstration à l’ENS « Atelier des Humanités Numériques » (Lyon 2016)
  • Préparation de la présentation d’Opentheso aux rencontres Huma-Num à Valpré (Lyon 2016)
  • Présentation d’Opentheso pour Bilissima, Inha, Inrap, ArScan (2015)
  • Intervention à la Journée TOTh 2014 au Musées royaux d’Art et d’Histoire de Bruxelles dans le cadre du projet européen AthenaPlus (www.athenaplus.eu)
  • Interventions à l’Université de Lyon pour les Master 1 et 2 (outils et gestion des référentiels)
  • Présentation d’une dizaine de Posters sur le thème  « les réseaux documentaires et le logiciel Opentheso ».

Réalisations

Mise à disposition d'une chaine de construction et de normalisation de thésaurus basée autour du logiciel Opentheso qui est développé par la plateforme en partenariat avec le réseau Frantiq, le consortium MASA et la TGIR Huma-Num.

Développement du logiciel Opentheso et des nombreux modules d'interconnexion avec des logiciels ou bases de données indépendants.

Opentheso est un gestionnaire de thésaurus multilingue et multi-hiérarchique. Il est conforme aux normes ISO 25964-1 2011 et ISO 25964-2:2012 (Information et documentation. Thésaurus et interopérabilité avec d’autres vocabulaires)

Le développement d’OpenTheso, commencé en 2006 avec l’assistance d’un stagiaire, puis d’un CDD, se poursuit toujours sous la direction de la plateforme en partenariat avec le réseau Frantiq et le consortium MASA.

En 2009, Opentheso avait bénéficié du soutien de la TGIR HumaNum, pour intégrer l’import et l’export au format SKOS (recommandation du W3C s’appuyant sur le modèle de données RDF). Ce travail avait permis de faire du thesaurus PACTOLS de Frantiq, géré avec Opentheso, l’un des référentiels utilisés par la plateforme Isidore (accès aux données numériques et services numérisés pour la recherche en sciences humaines et sociales). 

La version 4 d’Opentheso (dernière version) n'a fait quaccroître l’intéropérabilité des thésaurus, notamment via l’alignement des vocabulaires et répond mieux aux besoins des communautés de bibliothécaires mais aussi de chercheurs : elle permet un travail collaboratif via une interface web dont l’ergonomie a été testée en production par les équipes de Frantiq. Cette version est développée par Miled Rousset (chef de projet) et en s'appuyant sur des prestations et CDD grâce à la participation financière du Consortium MASA.

OpenTheso gère aussi les identifiants pérennes de type ARK et Handle qui sont basés sur la norme URI. La distribution d’identifiants Ark est gérée par le projet Arkéo située à la MOM.

Voici une liste de quelques fonctionnalités d'Opentheso :

  • Gestion avancée des termes et des branches
  • Drag and Drop
  • Gestion collaborative avec 4 niveaux d'authentification (superadmin, admin, manager et contributeur)
  • Interopérable : génération automatique d'identifiants Handle et ARK (ce service est assuré par le PSIR de la MOM)
  • WebServices REST
  • import : SKOS, Turtle, JsonLD
  • export : SKOS, Turtle, JsonLD, CSV et PDF

Son développement a été en partie financé par le GDS FRANTIQ, la MOM et la TGIR Huma-Num via le Consortium (MASA) Mémoire des archéologues et des sites archéologiques.

Opentheso est disponible en opensource sur la plateforme Github sous la licence CeCIL (type CeCIL-C).

Rayonnement

Depuis sa création, le cadre d’intervention de la plateforme est orienté réseau national et projets transversaux. Durant des nombreuses années, la plateforme a su montrer et partager son savoir faire et son expertise. Les nombreux projets actuels témoignent de sa forte position au sein des réseaux nationaux et européens.

Opentheso est devenu au cœur de nombreux réseaux et infrastructures, en voici quelques exemples :

OpenEdition, Invisu INHA, Frantiq, Phonothèque (MMSH), consortium MASA, consortium CAHIER, TGIR Huma-Num, OpenArchaeo, Hyperthesau, la chaine Métopes du Pôle Document Numérique PDN (qui est distribuée actuellement en France et à l’étranger), Zoomathia, laboratoire d’Ethnologie à Nanterre et bien d’autres en cours …

La plateforme propose aussi des formations aux utilisateurs, un transfert de savoir-faire pour aider les chercheurs, les porteurs de projets, à structurer leurs données de la recherche.

Projets en cours

  • Chantier scientifique pour la restauration de Notre-Dame de Paris (novembre 2020)
  • MASA La plateforme a répondu à l’appel d’offre CORPUS-IR pour le projet MASA (Mémoires des Archéologues et des Sites Archéologiques), elle a pris la responsabilité de l'axe2 (production et normalisation de vocabulaires controlés). Le projet est dans sa phase 3 sur 4.
  • OpenTheso IHM (Interface Homme Machine). En 2018, la plateforme a bénéficié d'un nouveau financement de MASA pour la refonte de l'interface graphique d'Opentheso (IHM). Un cahier de charges a été mis en place par la plateforme et le réseau Frantiq, la réalisation a été confiée à un designer en freelance, le projet avance bien et sera en phase finale à la rentrée de 2019.
    Contact : Miled Rousset