Data Management Plan
Les ressources à l’Ined et au Campus Condorcet
La MISO maintient dans le cloud Science Ouverte de l’Ined :
- un sous-dossier contenant tous les plans de gestion des données (PGD) ou, en anglais, Data Management Plans (DMP) rédigés à l’Ined
- un modèle de PGD de l’ANR prérempli par la DPD et archiviste de l’Ined, par le service juridique, le Service des Enquêtes et Sondages (SES)/DataLab, et le Service méthode statistique (SMS), avec les informations applicables aux projets menées à l’Ined.
Contactez la MISO miso[at]liste.ined.fr pour demander un accompagnement à la rédaction des PGD.
Sur le Campus, l'Humathèque offre aussi un service d'accompagnement pour les PGD. Contactez le service PGD de l'Humathèque à services.humathèque[at]campus-condorcet.fr.
Autres ressources
- Référentiels et outils de rédaction en ligne des PGD (ou DMP en anglais)
- Guides
DORANUM : Plan de gestion de données. Pourquoi et comment rédiger un plan de gestion de données ?
CIRAD : Rédiger un Plan de Gestion des Données
COSO : Plan de gestion de données – Recommandations à l’ANR
OpenAir : How to create a data management plan for Horizon 2020
Foire aux questions - Plan de Gestion de Données (PGD)
Cette Foire aux questions à été réalisée sur la base du site DoraNum par le groupe de travail PGD de l’Ined (BARON Julie, BENNAI Vanessa, FLEURIOT Christine, GUEVELOU Charlotte, JAIDANE Aida, MELEZE Sabine, NOUBOU NOUMOWE Leonel, PILI Alessandra, WOJCIK Martyna) et relue par le Service Accompagnement des projets et science ouverte de l’Humathèque (COLLIER Emmanuel, GISSINGER Jeanne, PEDROJA Cynthia). Elle est complémentaire au PGD Ined déjà prérempli et basé sur le modèle ANR.
I. Questions générales
1. Qu'est-ce qu'un PGD?
Le PGD pour Plan de Gestion de Données ou DMP pour Data Management Plan est un document évolutif qui précise la manière dont les données seront produites, traitées, décrites, partagées ou protégées et conservées au cours et à l’issue d’un projet. Il permet d’anticiper les questions de gestion des données qui surviennent au cours d’un projet de recherche, les conditions de diffusion et de conservation futures des données (Embargo ? Plan de conservation des données ? Taille des serveurs à prévoir ? etc.). Le PGD est un livrable obligatoire pour de plus en plus de financeurs nationaux (Agenre Nationale de la Recherche (ANR)…) ou européens (obligatoire par défaut pour Horizon depuis 2016, ERC notamment). En fonction du projet, 1, 2 ou 3 versions peuvent être demandées par les financeurs.
2. Est-ce obligatoire ?
Les bénéficiaires d’un projet financé par l’ANR sont obligés de fournir un Plan de Gestion de Données (PGD) depuis 2019. Cette obligation est également répandue auprès des financeurs européens, dont la Commission européenne, depuis 2016. Le PGD est une obligation contractuelle dans le cadre de contrats signés par plusieurs parties, la plupart du temps un financeur de la recherche et un ou plusieurs chercheurs/ laboratoires.
Quand il n’y a pas obligation, il y a souvent une forte recommandation. Par ailleurs, de plus en plus de financeurs s’alignent sur la procédure d’obligation de l’ANR et de la Commission européenne. Le PGD devient incontournable pour bien gérer vos données : au-delà de l’obligation, il faut envisager le PGD comme un outil de planification qui facilite votre travail de gestion des données et permet d’en envisager tous les aspects (démarches, budgets, etc.).
3. Est-ce un document juridique ?
Non, le PGD n’est pas un document juridique. Il est complémentaire à d’autres documents juridiques et administratifs et ne les remplace pas : conventions, AIPD, déclaration CNIL/DPD etc.
4. Le PGD garantit-il la conformité au RGPD ?
Le PGD ne remplace pas les démarches de conformité au RGPD mais peut y contribuer. Il doit intégrer les bonnes pratiques de gestion des données personnelles, en précisant les mesures prises pour assurer cette conformité. Cela inclut l’utilisation de techniques d’anonymisation ou de pseudonymisation, la gestion des droits des personnes concernées (accès, rectification, suppression), ainsi que la sécurisation des données.
5. Qu’est-ce que le RGPD et en quoi est-il pertinent pour un PGD ?
Le Règlement Général sur la Protection des Données (RGPD) est un cadre juridique européen qui encadre le traitement des données à caractère personnel. Il vise à protéger les droits et la vie privée des individus dont les données sont traitées. Pour un PGD, le respect du RGPD est essentiel dès lors que des données personnelles sont impliquées. Cela concerne la manière dont les données personnelles sont collectées, traitées, partagées et protégées tout au long du projet de recherche.
6. Le PGD est-il redondant avec d’autres documents ?
Le PGD permet de formaliser au sein d’un document unique des informations utiles au suivi du projet et à la bonne gestion des données, auparavant dispersées entre divers acteurs ou documents. Plusieurs documents peuvent ainsi contenir des informations pouvant être reprises dans les PGD (AIPD : Analyse d’Impact relative à la Protection des Données, par exemple…). Il peut ainsi exister des redondances partielles (reprise possible des paragraphes) mais chaque document à un objectif différent. Par ailleurs, il est un support de la mémoire du projet et permet de faire gagner du temps pour la documentation des données.
7. Doit-on rédiger un PGD en amont de la demande de financement pour avoir plus de chance d’être financé ?
Le PGD n’est en général exigé que si vous êtes financé et ne peut donc pas être un critère pour être lauréat d’un appel à projet. Par contre, réfléchir à la gestion des données de recherche et anticiper les besoins dans le domaine peut sûrement aider à structurer ou bien préparer son dossier.
8. Le PGD conditionne-t-il le versement du financement ?
Les agences de financement vérifieront que les différentes versions du PGD seront bien transmises quand elles exigent plusieurs versions. Le dernier versement de l’aide est conditionné par la réception d’un PGD et de ses mises à jour.
9. Quel est le délai pour transmettre le PGD au financeur ?
Cela dépend des financeurs. Une première version du PGD est généralement attendue à T0+6 mois après le démarrage scientifique (et non administratif) du projet. Il convient donc d’anticiper au maximum sa rédaction afin de pouvoir respecter cette exigence. Cette version sera mise à jour à mi-parcours (pour les projets de plus de 30 mois) ainsi qu’à la fin du projet. Pour les projets financés par l’ERC, une seule version est demandée à 6 mois. Les financeurs de la recherche exigent donc la plupart du temps :
- une première version du PGD 6 mois après l’acceptation du projet
- une version finale à la fin du projet
- pour les projets de plus de 30 mois, une version a mitan de la durée totale du projet.
Dans certains projets, un calendrier spécifique peut être demandé.
10. Il est dit que le PGD est un document évolutif. À partir de quel moment doit-on envisager son évolution ?
Le PGD peut être modifié à tout moment au cours d’un projet de recherche. Idéalement, dès qu’un élément de réponse change, il faut consigner cette modification dans le PGD.
Exemples :
- Nouveau jeu de données
- Modification du volume estimé
- Changement du logiciel utilisé pour le traitement des données
- Changements de personnels
- Avancée des réflexions sur le choix d’un standard de métadonnées
- Avancée des réflexions sur le choix d’un entrepôt ou d’une plateforme d’archivage pérenne
- Recommandations d’un juriste ou d’un comité d’éthique
- Informations sur les coûts
- etc.
11. Combien de temps faut-il envisager pour rédiger le PGD ?
Il est difficile d’évaluer le temps nécessaire à la rédaction d’un PGD, la durée est variable suivant le projet. La rédaction se fait au fur et à mesure de l’avancée de celui-ci. Un PGD pour une thèse menée de manière plus ou moins autonome sera bien plus facile et rapide à rédiger qu’un PGD se rapportant à un grand projet pluridisciplinaire et pluri-établissements.
En moyenne, si toutes les informations sont rassemblées, le PGD peut être rédigé en 1 à 2 jours.
Le PGD va permettre d’anticiper très tôt toutes les questions relatives à la gestion des données (nommage des fichiers, choix de l’entrepôt, documentation à préparer…) et favoriser ainsi la mise en place de bonnes pratiques de gestion tout au long du projet. C’est également une opportunité de dialogue entre les différents acteurs d’un projet : scientifiques, informaticiens, data librarians, juristes…Le PGD peut ainsi devenir un document de référence et faire gagner du temps aux équipes !
12. A quoi ressemble concrètement un PGD ?
Le cloud interne « Science Ouverte » rassemble les PGD en cours à l’Ined, disponibles ici.
Vous êtes invités à déposer votre PGD sur ce cloud et leurs versions finales sur Archined afin de centraliser les PGD produits à l’Ined et de capitaliser les expériences d’un projet à l’autre.
Pour les projets financés par l’ANR, les PGD doivent également être déposés dans HAL.
Des exemples de plans de gestions de données publics sont consultables à cette adresse.
13. L’ANR préconise-t-elle de rédiger le PGD en anglais ?
Le choix de la langue reste à l’appréciation du chercheur. Le modèle ANR est disponible en français et en anglais.
14. Les autres organismes préconisent-ils de rédiger le PGD en anglais ?
Le PGD peut être rédigé dans différentes langues, y compris en anglais, en fonction des exigences des organismes de financement, des institutions de recherche, ou des conventions du domaine scientifique concerné.
Bien que certaines agences nationales acceptent des PGD dans leur langue locale, l'anglais est généralement préféré ou requis pour maximiser l'impact et la visibilité internationale des recherches.
15. Est-il obligatoire d’utiliser le modèle de PGD de l’ANR ?
Non, il est possible d’utiliser un modèle institutionnel de PGD d’un des partenaires du projet ou tout autre modèle. L’Ined dispose par exemple de son modèle, réalisé à partir de celui de l’ANR. Si le projet est particulier et que les modèles ne semblent pas adaptés, il est possible de construire un PGD ad hoc spécifique qui reprend bien les différents postes à expliquer. Le site de l’ANR propose différents modèles de différents établissements. Il y a notamment un PGD Structure, quand il y a plusieurs enquêtes qui peuvent avoir des plans différents. Dans ce cas il s’agit de faire un PGD général pour le projet et inclure en annexe les PGD spécifiques des différentes enquêtes.
16. Faut-il fournir plusieurs PGD par projet ?
Non. Le PGD est un livrable unique, mais il aura plusieurs mises à jour, en moyenne 3 versions selon la durée du projet ou selon le planning indiqué (cf question n°9 ), sauf pour les ERC où 1 seule version est exigée. En revanche, s’il s’agit d’un projet comportant plusieurs enquêtes, comme indiqué en question n°15, il y aura bien un PGD par enquête.
17. Un projet de thèse peut-il être considéré comme un PGD ?
Un projet de thèse ne peut pas être considéré comme un PGD. En revanche, si une thèse est adossée à une enquête que vous produisez ou des données que vous réutilisez, le projet de thèse peut être un excellent début de PGD, car il aborde des thématiques que l’on retrouve dans ce genre de documents (objectifs du projet de recherche, type de données qui serviront à l’appuyer, etc.). Sur la question de la gestion des données, un PGD est plus exhaustif qu’un projet de thèse, d’autant plus qu’il est évolutif. La version finale du PGD peut éventuellement devenir une annexe de la thèse.
18. Doit-on rédiger un nouveau PGD pour un projet déposé 3 ou 4 ans après, faisant suite à un projet précédent terminé ?
Un nouveau projet implique un nouveau PGD. Si ce projet s’inscrit dans la continuité du précédent, le fait d’avoir rédigé un PGD pour le 1er projet facilitera en revanche la rédaction du PGD du 2e projet. Vous pourrez par exemple récupérer les informations qui sont toujours pertinentes, et les recopier.
19. Qui lit les PGD ?
Le PGD sera surtout lu par les collaborateurs, les chargés de projets scientifiques et les gestionnaires, et votre correspondant administratif à l’ANR (ou autre bailleur de fonds). Cela permettra de clarifier la politique de gestion des données mise en place pour ce projet. Il faut bien comprendre que le PGD est avant tout un outil de réflexion et de gestion de projet, utile pour mettre en œuvre de bonnes pratiques de gestion des données de recherche.
20. Faut-il répondre à toutes les questions du PGD ?
Vous devez répondre aux questions du PGD qui sont pertinentes par rapport à votre projet. Par ailleurs, vous ne pourrez pas répondre à toutes les questions dès le début du projet. Le PGD étant un document évolutif, vous pourrez compléter les réponses aux questions au fur et à mesure de l’avancée du projet.
21. Doit-on faire un PGD si on réutilise des données ?
Oui. Le PGD doit contenir les informations sur toutes les données produites, mais également sur les données existantes réutilisées au cours du projet. Il faut souvent dans ce cas justifier des mesures de protection des données délivrées par le fournisseur de données.
22. Il y a plusieurs types de données qui vont être produites, comment le renseigne-t-on dans le PGD ?
Le PGD doit contenir les informations sur toutes les données produites, brutes et analysées. Mais leur gestion peut être différenciée (dépôt dans un entrepôt différent, conditions de partage différentes…).
23. Je ne parviens pas à évaluer la volumétrie de métadonnées en début de projet, est-ce que je pourrais le changer plus tard ?
Il vous est demandé d’évaluer la volumétrie de vos données et métadonnées associées et de l’indiquer dans la 2e partie de votre PGD. Cette évaluation peut en effet s’avérer difficile en début de projet. Le PGD est un document évolutif qui peut être complété tout au long de votre projet. C’est la version finale qui devra indiquer la volumétrie exacte des données et métadonnées en lien avec votre projet.
24. Les logiciels développés au cours d’un projet font-ils partie des « données » ? Faut-il les inclure dans le PGD ?
Cela dépend de votre approche, de votre projet de recherche. Le logiciel peut jouer un triple rôle dans la recherche :
- Il sert d’outil dans de nombreux domaines, en traitant efficacement divers types de données pour construire et tester des modèles visant à étayer ou invalider des hypothèses.
- Il peut constituer en lui-même un résultat de recherche, en tant que preuve d’existence d’une solution algorithmique efficace pour un problème donné.
- Il peut être lui-même objet de recherche. En particulier, la communauté scientifique s’intéresse aux modes de développement des logiciels et à la preuve de leurs propriétés, en lien notamment avec la transparence et la confiance dans les traitements informatisés.
Dans tous les cas, il est recommandé de les inclure dans le PGD et de déposer les codes sources dans un entrepôt (indiquer l’entrepôt choisi dans le PGD). S’il y a changement du logiciel utilisé, le PGD devra être mis à jour (cf question 10).
A noter qu’il existe des modèles de Plan de gestion spécialement dédiés aux logiciels comme le modèle PRESOFT.
25. Qu’en est-il pour les données qualitatives ?
Tout comme pour les enquêtes quantitatives, les données qualitatives collectées ou réutilisées lors d’une enquête doivent faire l’objet d’un PGD si les financeurs l’exigent. Même en l’absence de PGD, une analyse d’impact restera nécessaire, et celle-ci vise également à tracer la protection des données. Ainsi, la base de contact, les enregistrements audios, les retranscriptions, les analyses… sont des données et il faut articuler leur circulation et sauvegarde avec toutes les précautions du RGPD.
II. Et à l'Ined ?
26. J’ai besoin d’un PGD, qui dois-je contacter à l’Ined pour initialiser la démarche ?
La direction des relations internationales et des partenariats (DRIP) est le point d’entrée pour les PGD à l’Ined. Elle propose un accompagnement et un suivi du PGD tout au long du projet. Vous devez contacter Sabine MELEZE (sabine.meleze@ined.fr) et Martyna WOJCIK (martyna.wojcik@ined.fr) pour les projets nationaux, et Sabine MELEZE et Thomas WIEST (thomas.wiest@ined.fr) pour les projets internationaux et/ou européens.
Après avoir initialisé la démarche, la DRIP vous indiquera :
-Les jalons pour votre projet
-Les modèles préconisés
-Les documents mobilisables pour aider à remplir le PGD
-Les personnes compétentes à l’Ined pour vous aider à compléter le PGD : DPD, Archiviste, service informatique, SES, SMS etc.
En cas de saturation de la DRIP, l’Humathèque (services.humathèque@campus-condorcet.fr) peut également vous accompagner sur le montage du PGD et sa relecture. Par ailleurs, l’Humathèque propose des formations d’acculturation à la Science Ouverte, dont des formations spécifiques sur les PGD : https://www.humatheque-condorcet.fr/fr/pour-la-recherche/offre-de-formations/science-ouverte-1.
27. Quand dois-je contacter les personnes susceptibles de m’aider ?
Dès l’acceptation du projet / dès démarrage scientifique de projet.
28. Quel est le modèle de PGD à utiliser ?
Un modèle Ined, basé sur le modèle de PGD ANR a été conçu par les différents services de l’Ined compétents. Celui-ci est pré-rempli avec des paragraphes types qui concernent généralement la réalisation d’une enquête quantitative produite à l’Ined. N’hésitez pas à l’adapter à votre projet. Vous pouvez retrouver ce modèle dans le cloud dédié.
D’autres modèles existent et sont disponibles à cette adresse : https://dmp.opidor.fr/public_templates#content
29. Qui doit rédiger le PGD?
L’équipe scientifique en charge du projet rédige une première version à partir du modèle ANR-Ined pré-rempli ou d’un autre modèle plus adapté. Cette première version est complétée, enrichie, corrigée, par l’ensemble des personnes concernées (DPD, archivistes, SES, informatique…) avec une coordination par la DRIP.
Sa rédaction est un travail de groupe, qui fédère les compétences des scientifiques, informaticiens, documentalistes, archivistes, juristes, chargés de la valorisation…
Une relecture peut être demandée auprès de l’Humathèque.
30. Qui peut m’accompagner pour rédiger le PGD?
Plusieurs services vont intervenir dans le PGD, pour conseiller sur la rédaction :
1. la Drip : interlocutrice pour le suivi global du projet et la redirection vers les interlocuteurs qui assisteront l’équipe de recherche dans la rédaction du PGD ;
2. le SISI : interlocuteur pour le stockage et la sécurisation des données ;
3. l’archiviste : interlocuteur pour l’archivage et la conservation des données ;
4. la DPO : l’interlocutrice de référence pour contrôler la conformité réglementaire des traitements de données à caractère personnel réalisés dans le cadre du projet. L’ensemble des formalités effectuées dans ce cadre fournira des informations qui pourront être utilisées au sein du PGD ;
5. le SES : interlocuteur pour les questions relatives à l’ouverture des données et à leur partage une fois l’exploitation de l’enquête terminée (notamment via Quetelet Progedo Diffusion) ;
6. le SMS : interlocuteur sur les questions liées à la provenance des données, au contrôle qualité des données.
31. Où déposer mon PGD ?
Dans tous les cas, il est primordial de déposer vos PGD définitifs sur Archined. Cela permet de centraliser les PGD produits à l’Ined et de capitaliser les expériences d’un projet à l’autre. Il est possible d’attribuer aux versions intermédiaires une visibilité restreinte pendant la durée du projet, puis de le rendre public une fois le projet terminé. Si l’organisme financeur est l’ANR vous devez également le déposer sur la page dédiée au suivi de projet de l’ANR : un onglet spécifique est prévu pour le dépôt du PGD et de ses mises à jour : https://aap.agencerecherche.fr
Enfin, lors du dépôt sur Archined, il est recommandé d’exporter son PGD vers HAL.
Dernière mise à jour : 16/12/2024