Données volumineuses de santé : application à la pratique médicale

27 avril 2020 - 10 minutes de lecture

Cover Image

Le numérique envahit toutes les dimensions de la médecine

C'est le cas notamment de la prévention, du diagnostic, de la prise en charge, de la recherche médicale et de la communication en santé. Cette évolution est clairement indispensable de façon à saisir, stocker, sécuriser, partager, visualiser et analyser des données qui ne cessent de s’accumuler. Le cerveau humain, seul ou même en réseau (intelligence collective) ne peut, et depuis plusieurs décennies déjà, assurer toutes ces fonctions. Ce virage numérique de la médecine ne doit pas être perçu comme une fragilisation du lien humain ; il doit au contraire permettre de le renforcer, libérant du temps pour le médecin [1] [2] pour répondre au problème d’accès aux soins, pour sa formation continue ou encore pour renforcer ses relations avec ses patients.

Les données de santé foisonnent

Les données de santé sont en effet nombreuses et de plus en plus accessibles. Elles proviennent des systèmes d’information des hôpitaux, des cliniques, des laboratoires d'analyses médicales, des praticiens eux-mêmes, des bases de remboursement des soins de la sécurité sociale et des complémentaires de santé, des réseaux sociaux. Elles jouxtent ainsi les données info-communicationnelles en santé, comme d’ailleurs les données environnementales ou celles issues des publications et autres produits de la recherche médicale ou de sociétés savantes (telles que les recommandations pour la pratique clinique). Ces données permettent de plus en plus de réfléchir en dehors du principe habituel (de tester des hypothèses construites a priori) pour la recherche des causes et facteurs de risque des maladies et bientôt pour le diagnostic et la prise en charge des patients. Dans un avenir proche, elles devraient en effet pouvoir aider le patient individuel, et donc favoriser l’émergence d’une médecine de précision, centrée autour d’un patient unique, intégrant son histoire clinique, ses antécédents, son mode de vie, son environnement, son parcours de soins. Encore faut-il pouvoir analyser ces données en toute confiance et sur des durées d’interrogation courte (au mieux en temps réel). Les données de santé individuelles sont en effet chrono-sensibles.

Les données massives de santé font partie de ce que l’on nomme maintenant le big data

Le big data désigne « des ensembles de données devenus si volumineux qu'ils dépassent l'intuition et les capacités humaines d'analyse et même celles des outils informatiques classiques de gestion de base de données ou de l'information » [3]. Les données s’accumulent, évoluent, sont souvent non structurées, redondantes et peuvent être contradictoires. Le développement d'applications à visée analytique (big analytics) vise à traiter les données pour en tirer du sens. Les technologies d’aujourd’hui ne permettent cependant pas encore de le faire complètement.

L’application en recherche des méthodes d’analyse des données massives de santé est un défi pour l’avenir

Elle soulève des questions (Encadré 1), pas uniquement technologiques, telles que : (i) la capacité de stockage et de traitement des données (besoin de serveurs, superordinateurs, algorithmes, ingénierie logicielle avec développement des noyaux de calcul et des interfaces nécessaires) ; (ii) la fragmentation des données (hétérogènes de par leur nature, leur format, leur dispersion au sein de plusieurs systèmes d'information, avec, pour l’instant, un besoin de structuration et de codage avant de pouvoir être intégrées dans des bases, des entrepôts de données) ; (iii) la sécurité des données et l’accès aux données (avec nécessité de la désidentification du patient pour la recherche, demande d’accès au Système National des Données de Santé / Health Data Hub, déclaration à la Commission Nationale de l’Informatique et des Libertés de protection des données et déclarations aux Comités de Protection des Personnes) ; et (iv) l’analyse, la pertinence, la véracité, l’interprétation et la reproductibilité des données (avec, à ce stade précoce, la participation de personnes de différentes disciplines, et notamment de cliniciens, pharmaciens, immunologistes, biologistes, techniciens de laboratoire, responsables de la prévention de la santé, assistants sociaux, assistants de recherche clinique, gestionnaires de bases de données, spécialistes en info-communication, épidémiologie et santé publique, bioinformaticiens, biostatisticiens et autres mathématiciens). Toutes ces questions doivent trouver des réponses et font depuis plusieurs années l’objet d’intenses réflexions et propositions au plus haut niveau de l’état français [1] [2].

Encadré 1 : Les cinq grands enjeux du big data.
•    Volume : quantité énorme (en zetta, yotta ou brontobytes)
•    Variety : variété, structure, hétérogénéité, chainage, recodage, données manquantes
•    Velocity : vitesse, fréquence d’acquisition (genèse, capture, partage)
•    Veracity: fiabilité
•    Value : valeur

Dans le domaine des données de santé, la France a été visionnaire

La France a mis en place il y a vingt ans le Système national d'information inter-régimes de l'assurance maladie (Sniiram) et son chaînage au Programme de Médicalisation des Systèmes d'Information (PMSI). La loi du 27 janvier 2016, consacrée à la modernisation de ce système, traite de la création « d’un accès ouvert aux données de santé » [4] et créé en 2017 le Système National des Données de Santé (SNDS) avec pour tâche « de contribuer à la recherche, aux études, à l’évaluation, et à l’innovation dans les domaines de la santé […] » [5] en offrant le cadre et l’hébergement de milliards de données cliniques produites par ces structures. Au 1er décembre 2019, la plateforme des données de santé (Health Data Hub) remplace le SNDS de façon à « mettre au service du plus grand nombre notre patrimoine de données de santé sous une forme anonymisée, dans le respect de l’éthique et des droits fondamentaux des citoyens » [6].

Par ailleurs, afin d’améliorer les soins, les établissements hospitaliers se regroupent en Groupements Hospitaliers de Territoire (GHT) et mutualisent peu à peu leurs systèmes d’information [4] [7]. Les données volumineuses provenant de différents hôpitaux vont donc constituer une richesse d'information médicale sans précédent, donnant la possibilité d’extraire un savoir et de nouvelles connaissances [8]. Ces bases devront être complétées par les données provenant de la médecine libérale (cliniques et cabinets de soignants) et du monde digital citoyen (informations issues des réseaux sociaux et requête internet, capteurs e-santé et objets connectés) [9]. Le recueil des données de santé et psycho-sociales ne se fera donc plus uniquement par les professionnels de santé mais également à travers un ensemble de capteurs intégrés à l’individu.

La plateforme AdviceMedica est une source originale de données. Depuis janvier 2018 elle permet à des médecins d’échanger sur les cas complexes qu’ils rencontrent dans leur pratique médicale. Les utilisateurs d’AdviceMedica reçoivent tous les matins un email, sous forme d’une newsletter correspondant aux réseaux d’intérêt qu’ils ont pré-choisis. Les médecins qui ont déjà rencontré un cas similaire répondent s’ils le souhaitent et les différentes réponses sont envoyées chaque matin au fur et à mesure qu’elles arrivent. Les cas résolus sont stockés. Grâce aux outils de l’intelligence artificielle, la recherche de similarités et une aide à la décision y sont associés.

  1. Recourir au numérique pour mieux soigner. Disponible sur : https://solidarites-sante.gouv.fr/systeme-de-sante-et-medico-social/masante2022/article/recourir-au-numerique-pour-mieux-soigner (consulté le 21.11.2019).
  2. Ma Santé 2022 : un engagement collectif. Disponible sur : https://solidarites-sante.gouv.fr/systeme-de-sante-et-medico-social/masante2022/ (consulté le 21.11.2019).
  3. https://fr.wikipedia.org/wiki/Big_data (consulté le 21.11.2019).
  4. Hollande F. Loi n° 2016-41 du 26 janvier 2016 de modernisation de notre système de santé. Journal officiel, n°0022, 27 janv. 2016. Disponible sur : https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000031912641&categorieLien=id (consulté le 21.11.2019).
  5. CNIL. Protéger les données personnelles, accompagner l'innovation, préserver les libertés individuelles. SNDS. 2018. Disponible sur : https://www.cnil.fr/fr/snds-systeme-national-des-donnees-de-sante (consulté le 21.11.2019).
  6. La plate-forme des données de santé verra le jour le premier décembre. Disponible sur : https://www.acteurspublics.fr/articles/la-plate-forme-des-donnees-de-sante-verra-le-jour-le-premier-decembre. (consulté le 24.11.2019).
  7. Remize M. Les groupements hospitaliers: "une vraie révolution !". Archimag, Oct. 2017, n° 308, p. 18-19.
  8. Raghupati W, Raghupati V. Big data analytics in health care: promise and potentia. Health Information Science and System. 2014.
  9. Marcon C, Grosjean S, Mallowan M. Introduction : Méthodes et stratégies de gestion de l’information par les organisations : des « big data » aux « thick data ». Revue COSSI, 2018, n° 1. Disponible sur : http://revue-cossi.info/1054-numeros-de-revue/n-1-2018-big-data-thick-data (consulté le 21.11.2019).

Vignette auteur

Pascal Demoly

Coordinateur scientifique pour AdviceMedica.
Docteur en médecine, professeur de pneumologie, allergologue et chef de département au CHU de Montpellier.