Création de fiches sur le catalogue

Création de fiches sur le catalogue

A propos

Pour entreposer les datasets dans le catalogue conçu pour l’occasion (https://www.sedoo.fr/catalogue-openopse), il est nécessaire de fournir, pour chacun d’eux, un certain nombre de métadonnées.

Liste des métadonnées du catalogue OPSE / Niakhar / Environnement

/!\ Les fiches de métadonnées sont à renseigner en anglais.

PS : Pour certains champs (titre, résumé, descriptions…), nous retrouvons une cellule ‘en’ (english) et une cellule ‘fr’ (french). Seule la cellule ‘en’ est obligatoire, il faut donc renseigner cette cellule en priorité et en anglais. A défaut, en français s’il n’existe pas de version anglaise de l’information.

Onglet « Information »

The title

Correspond au titre du jeu de données (version english/french). Remplir l’onglet « English » en priorité avec un titre en anglais, éventuellement remplir aussi l’onglet « French » avec un titre en français.

Abstract

Résumé du jeu de données (version English/french). Remplir l’onglet « English » en priorité avec un résumé en anglais, éventuellement remplir aussi l’onglet « French » avec un résumé en français.

SpatialExtents (OBLIGATOIRE)

Délimitation de la zone d’étude. Cette zone peut être un point géographique (type = ‘POINT’) ou un rectangle géographique (type = ‘RECTANGLE’).

Choisir le type de spatial extents et remplir les champs correspondants à l’aide des coordonnées géographiques exprimées en degrés décimaux.

spatial extents de type point
spatial extents de type area

Description’ : Ajouter ici (entre autres) le système de géo-référencement (WGS-84 / UTM Zone 28N…)

Exemples de « spatial extents » :

  • Pour un jeu de données issu de mesures instrumentales au niveau du site collaboratif Faidherbia Flux : un rectangle qui inclut l’ensemble du site Faidherbia Flux. Éventuellement un point précis si le jeu de données se rapporte à un capteur fixe / un point de mesure bien géo-localisé.
  • Pour un jeu de données issu de suivis d’expérimentations agronomiques au niveau de plusieurs villages : un rectangle qui inclut l’ensemble des territoires villageois concernés.

TemporalExtents (OBLIGATOIRE)

La ou les différentes périodes d’études ayant amené au dataset. Plusieurs lignes et donc plusieurs intervalles de temps peuvent être renseignés, avec des commentaires facultatifs (Remplir l’onglet « English » du commentaire en priorité avec un commentaire en anglais, éventuellement remplir aussi l’onglet « French » avec un commentaire en français).

PlatformSet (FACULTATIF)

A renseigner uniquement si le dataset a été produit au niveau d’une plate-forme / station bien définie (par ex. une tour à flux, une parcelle ou un champ en particulier, un arbre ou un groupe d’arbre, un puit, une chambre de mesure pneumatique…).

NB : Il faut choisir le type de plateforme dans la liste du dessus et ensuite ajouter un nom et une description. Remplir l’onglet « English » de la description en priorité avec une description en anglais, éventuellement remplir aussi l’onglet « French » avec une description en français.

Ex. de noms de plateformes : ‘FaidherbiaFlux_TallAntenna’, FaidherbiaFlux_Hydroseve_Well5’, ‘FaidherbiaFlux_Hydroseve_Tree5’, ‘FaidherbiaFlux_TallAntennaPlot’…

Sites (FACULTATIF)

Informations sur le ou les sites de l’étude. Renseigner le maximum de champs possible pour chaque site. Il peut notamment s’agir du ou des villages où ont été collectées les données. Seul un point géographique peut être renseigné à ce niveau (par défaut le centre du village).

Instruments

Informations sur le ou les instruments utilisés pour mesurer les différents paramètres (variables) du jeu de données.

Si plusieurs instruments à référencer pour un même jeu de données, préciser dans la colonne ‘description’ à quel(s) paramètre(s) l’instrument se rapporte.

Le nom de l’éventuel logiciel de traitement, la fréquence initiale d’observation, la couverture horizontale / verticale peuvent également être renseignés au niveau du champ ‘description’.

NB : Il faut choisir le type d’instrument dans la liste du dessus avant de remplir les autres champs

Parameters

Informations sur le ou les paramètres / variables du dataset.

‘Comment’ : peuvent être décrits dans ce champ la méthode d’acquisition, l’historique du traitement, éventuellement le nom du logiciel ou du modèle utilisé, une note sur la qualité des données de la variable (1/5 = poor à 5/5 = excellent). Toutefois, s’il s’agit d’informations communes à l’ensemble des variables, les renseigner prioritairement sur le champ ‘process level’ de la fiche.

Ex. de ‘type’ : meteo, flux, soil, vegetation, tree…

Contacts (OBLIGATOIRE)

Informations sur les différents contacts du dataset. Il peut s’agir d’une organisation et/ou d’une personne physique.

Dans la mesure du possible, renseigner le numéro ‘ORCID des personnes et le numéro ‘ROR’ des organisations selon choix du type de contact.

Pour chaque contact renseigné, il faut choisir son rôle dans la fiche du jeu de données. Les autres champs disponibles doivent également être remplis à savoir : first name-mandatory, last name-mandatory, email, ORCID, Organizations, comments etc… Pour les contacts de type « person » et les champs suivants : Name, web site url, email, ROR, comments etc… pour les contacts de type « organisation ».

Conseils pour identifier les rôles des personnes contacts :

  • Il faut renseigner à minima un « Principal Investigator » (considéré comme l’auteur / chercheur principal), éventuellement d’autres « Authors » voir « Contributors » (ordre hiérarchique d’importance, parmi les créateurs d’un même jeu de données)
  • Il faut essayer de ne pas multiplier les rôles pour un même contact : un PI est par défaut un auteur, pas besoin de le préciser.
  • Par défaut le « Point of contact » est le « Principal Investigator » (dans ce cas pas besoin de renseigner un « Point of Contact »). Par contre si le PI et le PoC sont deux personnes différentes, le préciser.
  • Le « Point of Contact metadata » sera renseigné par nos soins : il s’agit du SEDOO (www.sedoo.fr)
  • Renseigner un ou plusieurs « Funders » et « Originators » (initiateurs) est facultatif.
  • Renseigner un « Custodian » (conservateur), un « Publisher » ou encore un « Resource provider » n’est pas nécessaire, sauf cas particulier.

Keywords (OBLIGATOIRE)

Énumérer ici les différents mots clés qui se rapportent au jeu de données. Dans la mesure du possible, écrire en minuscule, sans accent, au singulier, en anglais. Pour valider un mot-clé, il suffit d’appuyer sur la touche « entrée » du clavier.

Ex. de mots-clés : biodiversité/biodiversity

ProcessLevel

Renseigner ici le niveau de traitement des données (il s’agit ici des données instrumentées ou séries temporelles). Indiquer dans le champ ‘name’ l’ensemble des traitements du jeu (ex : « Native, filtered and interpolated »).  

Ex de ‘process level’ : données brutes / native ; valeurs aberrantes supprimées ; données agrégées ; incorporation de valeurs externes ; completed with few missing data ; gap-filled manually ; gap-filled using statistical model ; filtered ; interpolated ; modelled ; forced…

Préciser dans le champ ‘description’ l’historique du traitement ou de la méthode d’acquisition, éventuellement le nom du logiciel ou du modèle utilisé, le protocole de validation et/ou le contrôle qualité réalisé, éventuellement une note sur la qualité des données (1/5 = poor à 5/5 = excellent). Mentionner également ici si c’est pertinent les différences de traitement qui s’appliquent aux différentes variables du dataset.

Milestones

‘Creation date’ : date de la première mesure du jeu de données, plutôt que la date de transmission du dataset par le PI ou la date de création du fichier de données.

‘Date de publication’ : date la plus importante, celle transmise pour la création du DOI du dataset (= date de demande du DOI)

‘Last revision date’ = doit coller avec les infos du module « version » (à priori cela ne nous concernera pendant la durée du projet OpenOPSE : nous mettrons en ligne uniquement une première version de chaque jeu de données)

Information links

Indiquer ici des liens URL vers les pages web en lien avec le dataset (éviter les doublons avec les documents « references » qui eux seront déposés sur le ftp du catalogue et disponible au téléchargement au même titre que les fichiers de données). Renseigner notamment les URL des pages de description des projets (ACASIS, RAMSESII…) du website des OPSE (celles en lien avec le dataset).

References

Renseigner ici l’ensemble des références liées au dataset : articles, mémoires, publications diverses, rapports techniques, protocoles expérimentaux, communications diverses, notices d’instruments…

Ne pas oublier de joindre par retour de courriel à l’équipe les documents qu’il faudrait ajouter. Les documents en libre accès pourront être directement téléchargés dans la future fiche du catalogue, au même titre que les fichiers de données.

Merci de penser également à faire parvenir à l’équipe des photos (instruments, arbres, scènes d’enquêtes ou d’expérimentation, etc.) : elles pourront être visualisées dans la future fiche du catalogue.

  • ‘doi’ : si la référence possède déjà un DOI (Digital Object identifier), pas besoin de renseigner les autres champs.
  • Pour un document sans DOI, veiller par contre à bien renseigner les autres champs (à minima ‘title’, ‘authors’, ‘description’, ‘publication year’).

Projects

Choisir le ou les projets dans le(s)quel(s) s’inscrit le jeu de données qui sera associé à la fiche.

Resource type

Renseigner ici le type de ressource associé au jeu de données. Par défaut, pour les jeux de données du catalogue, il est renseigné « dataset ».

Onglet « Download »

DOI = Digital Object Identifier

Veiller saisir le DOI du jeu de données s’il en existe déjà un  (pour les fiches de métadonnées correspondant à un jeu de données déjà existant sur un autre catalogue de données en ligne).

Dans la majorité des cas, les jeux de données déposés sur le catalogue n’auront pas de DOI. C’est le SEDOO qui va attribuer un DOI aux jeux de données lorsque vous en ferez la demande en cliquant sur le bouton « ask for DOI » dans le menu édition. Lorsque la demande est faite et validée par le SEDOO, le DOI et la référence du jeu de données seront visibles dans ce bloc. Il ne faudra plus y toucher par la suite.

Data policy

La politique de données (Data policy en anglais) correspond à la licence à associer au jeu de données.

Remplir cette partie en choisissant parmi les différentes options suivantes :

  • Indicate a licence :

Indiquer le nom, la version et le lien de la licence.

  • Provide a detailled description :

Une description en français ou en anglais est demandée.

  • External license url :

Renseigner le lien de la licence à utiliser.

  • Do not use a license:

Signaler qu’aucune licence n’est utilisée.

Data access

 Accès au téléchargement entier ou à une partie des données en sélectionnant les données voulues.

  • Données séries instrumentées

Une fois la « data policy »  acceptée, il est possible de télécharger toutes les données ; soit sélectionner le ou les paramètres et/ou la ou les années et ensuite télécharger ces données.

  • Données ortho images

En premier, sélectionner le type d’image. Après avoir accepté la data policy,

il est possible de télécharger toutes les données ; soit sélectionner la ou les années et ensuite télécharger ces données.

dataAcessMa

Choisir le niveau d’accès au téléchargement des données.

Opensearch Links ( A NE PAS MODIFIER)

Ce champ sera rempli automatiquement et est utilisé pour des besoins internes du catalogue.

Versions

Préciser les versions présentes du jeu de données si elles existent. Remplir les champs : Version (ex : 1.0), Date (choisir une date), Type), Description.

Formats

Préciser le ou les formats des données.

Sur l’onglet « information », remplir les champs « name – mandatory », une version, une description en français ou en anglais et un « reading information » en français ou en anglais également.

Sur l’onglet « temporal interval », remplir la période (date début – date fin)  de validité du format, ainsi qu’un commentaire facultatif . Remplir l’onglet « English » en priorité avec un commentaire en anglais, éventuellement remplir aussi l’onglet « French » avec un commentaire en français.

Acknowledgements

Bloc auto rempli avec la phrase de remerciements. Cette phrase est obligatoirement citée lorsque des personnes utilisent un jeu de données dans d’autres travaux.

Onglet « Visualisation » ( A NE PAS MODIFIER)

  • Pour les données issues de séries instrumentées

Pour prévisualiser ces jeux de données, sélectionner un ou plusieurs paramètres, et/ou une date. La courbe des données sélectionnées apparaît sur le graphique. Il est possible de zoomer sur cette courbe.

  • Pour les données géo référencées (shapefile/raster)

La prévisualisation des données géo référencées apparaît sur une carte. Si les données ne concernent qu’une année, il n’y a pas de choix possible pour la prévisualisation. Si les données concernent plusieurs années, il est possible de les sélectionner sur la frise au-dessus de la carte pour les prévisualiser directement sur la carte.

Onglet « Interoperability » ( À NE PAS MODIFIER )

Dans cet onglet se trouvent des détails sur les différents blocs suivants:

  • Le principe FAIR (Findable, Accessible, Interoperable, Reusable): Principe d’organisation des données pour faciliter l’accessibilité, la compréhension et la réutilisation,
  • L’UUID de la fiche (identifiant unique de la fiche sur le catalogue),
  • Le « Metadata API » permettant d’extraire les métadonnées de la fiche,
  • Le « CATALOGUE API » qui est lien du catalogue auquel appartient la fiche.

Ces blocs ne sont pas à remplir.

Rechercher