"Si nous optimisons l'utilisation des données de santé, nous sommes convaincus qu'elles sont sources d'innovation et d'efficience pour notre système de santé", d'après Emma Ros, chargée de projets Santé au sein de l'Institut Montaigne, un think tank sur les politiques publiques. Il est à l'origine d'une étude qui vient de paraître ce 27 février. Baptisée "Données de santé : libérer leur potentiel", elle repose sur l'audition "d'une soixante de personnes du monde public et privé pour avoir les différentes tendances et freins", a détaillé l'experte à L'Usine Digitale.
Donner une seconde vie aux données de santé
L'objectif de l'utilisation secondaire des données de santé est, comme l'expression l'indique, de donner une seconde vie aux données. Chaque jour, les professionnels de santé et les patients produisent de nombreuses données qui alimentent les dossiers médicaux, les bases de remboursement de l'Assurance maladie ainsi que les systèmes d'informations des établissements de santé. Ces données sont collectées dans le cadre du soin. Comme l'explique l'Institut Montaigne, "il est possible de donner une seconde vie à la donné de santé à travers l'utilisation secondaire : il s'agit ici de tirer avantage des données récoltées dans le cadre du soin".
Les bénéfices de l'utilisation secondaire sont immenses, d'après l'étude. Emma Ros en cite quelques-uns, tel que le raccourcissement de la durée des essais cliniques en mettant à disposition des chercheurs des cohortes de patients, ou des cohortes de contrôle, dans des délais rapides et de les rendre plus fiables. Elle mentionne également la mise en place de "bras de contrôle synthétiques" qui désigne "une cohorte de patients virtuels présentant l'ensemble des propriétés des patients réels". Outre "le gain de temps", ce dispositif permet de "réduire l'effet placebo détectable dans le cadre d'un essai clinique en vie réelle".
Alimenter des algorithmes
Les données de santé peuvent aussi être réutilisées pour développer des systèmes d'apprentissage automatique. L'experte mentionne plus particulièrement les systèmes de détection précoce des cancers. Enfin, elles pourraient permettre de piloter plus efficacement le système de santé français, d'après l'étude, qui connaît de nombreuses difficultés. Pourtant, la France a été "un pays pionnier avec le SNDS", créé par la loi du 26 janvier 2016. Pour rappel, le système national des données de santé permet de chaîner plusieurs bases de données, parmi lesquelles les données de l'Assurance maladie, les données des hôpitaux ou encore les causes médicales de décès.
Mais depuis, elle a perdu son avance d'après un classement de l'Organisation de coopération et de développement économiques (OCDE) qui place l'Hexagone en quatorzième position en ce qui concerne la maturité de ses bases et la possibilité d'accéder aux ensembles de données de santé et de les coupler.
"Ne pas rater le tournant"
A l'aube de la publication de la stratégie nationale sur la réutilisation et l'ouverture des données de santé, prévue au premier semestre 2024, l'Institut Montaigne a voulu comprendre ce qui bloquait et proposer des solutions. "Il est urgent d'agir pour ne pas rater le tournant", alerte Emma Ros.
Quatre catégories de freins ont ainsi été identifiées. Les freins "techniques" reposent sur le fait que "80% de la donnée de santé n'est pas standardisée, c'est-à-dire qu'elle reste dans les dossiers médicaux", détaille-t-elle. De fait, les 172 bases que compte le système de santé français ne peuvent pas communiquer entre elles. Or, "pour qu'une donnée de santé soit juste, précise et puissante, elle doit être couplée avec d'autres informations". Second problème : les bases de données dédiées à la médecine de ville sont encore trop peu nombreuses alors que "87% des assurés de l'Assurance maladie vont voir un médecin généraliste alors que seuls 18% se rendent à l'hôpital". Ainsi, "il y a un pan entier du parcours de soin qui demeure non couvert".
Etablir un cadre économique du partage de la donnée
Le deuxième type de frein est "économique". Il est lié au fait qu'il n'existe pas de cadre économique autour de la production, de l'échange puis de la réutilisation de la donnée de santé, indique la chargée de projets. "Cette absence de cadre révèle un réflexe propriétaire", estime-t-elle. Elle propose donc la mise en place de "grilles de tarification" pour les producteurs des données. Ce n'est pas le coût de la donnée en tant que tel qui compte mais tout le travail en amont (standardisation, stockage...), détaille-t-elle.
L'autrice cite également des freins "juridiques" qui empêchent de pleinement exploiter les données de santé. "Depuis l'arrivée du Règlement général sur la protection des données en 2016, le cadre a été beaucoup modifié, relate Emma Ros. Même les acteurs dans les institutions ont parfois un peu de mal à l'appréhender, à le comprendre." L'étude préconise donc de mener des campagnes de communication sur les droits conférés par cette législation aux patients, ce qui permettrait de lever les freins "citoyens". Les professionnels de santé devraient aussi être sensibilisés aux bénéfices de l'utilisation secondaire des données de santé, poursuit-elle.
L'absence d'arbitrage sur le stockage du Health Data Hub freine son déploiement
Difficile de parler de l'aspect juridique sans évoquer le couac du Health Data Hub, vitrine de la réutilisation des données de santé puisque l'objectif de cette base de données est de permettre aux chercheurs d'alimenter leurs réflexions par des données issues du système de santé. Sur ce sujet, et sans grande surprise, l'Institut Montaigne juge que "l'absence d'arbitrage politique sur la solution d'hébergement du Health Data Hub freine ainsi le déploiement de sa stratégie et notamment le transfert de la copie du SNDS" vers cette base de données.
Depuis sa création par un arrêté du 29 novembre 2019, le Health Data Hub est hébergé par Microsoft Azure malgré les risques de transferts de données vers les Etats-Unis. Une solution souveraine sera trouvée d'ici 2025, a promis le gouvernement qui reste très discret, voire absent, sur ce sujet malgré les nombreux appels des fournisseurs français de cloud computing. Le débat a été relancé récemment avec l'attribution du marché de l'hébergement d'EMC2, une base de données opérée par le Health Data Hub en réponse à un appel d'offres de l'Agence européenne des médicaments (EMA), à Microsoft. Le tout validé pour trois ans par la Commission nationale de l'informatique et des libertés (Cnil) "faute de prestataire susceptible de répondre actuellement aux besoins exprimés".
L'Usine Digitale a voulu connaître la position l'Institut Montaigne sur le sujet de l'hébergement dit "souverain" de cette immense base de données. "Nous n'avons pas souhaité nous positionner sur la partie technique, répond Emma Ros. C'est un choix politique qui va au-delà de ce que nous avons souhaité traiter dans la note."


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
