fbpx

Le Big Data en santé

Big Data en santé

Le domaine de la santé utilise de plus en plus les données.

Le système de santé traditionnel va se transformer petit à petit grâce à l’utilisation du numérique et des nouvelles technologies. Si aujourd’hui, la santé du monde est sujette à diverses expérimentations, elles se développeront bientôt grâce aux données. Découvrez comment grâce à cet article.

Qu’est-ce que le Big Data en santé ? 

Comme tous les secteurs d’activités et tous les domaines, le domaine de la santé figure parmi ceux qui commencent progressivement à utiliser les données pour des résultats beaucoup plus concrets. Si auparavant, il a fallu des années pour avoir une séquence de génome humain, aujourd’hui, grâce à l’exploitation des données, il suffit d’une journée au maximum pour l’avoir. Même cas pour les études génétiques ou les essais cliniques, biologiques, etc. A l’heure actuelle, avec plusieurs données disponibles, les différentes recherches et les différentes analyses en santé sont facilitées. Elles sont devenues indispensables, non seulement par rapport aux progrès médicaux mais également à la sécurité des patients. Ci-après des exemples de données exploitables en santé. 

  • Les données médico-administratives : ce sont des données concernant le recours aux soins, les hospitalisations, le handicap ou l’activité professionnelle. Elles permettent d’avoir des bases de données anonymes. En France par exemple, il y a ce qu’on appelle le SNDS ou Système National des Données de Santé. Ce système a été créé en 2016. Il est constitué de plusieurs types de données  qui permettent de faire différentes études, recherches ou analyses dans le domaine de la santé. Ces données permettent aussi d’informer sur la santé de la population, de mettre en œuvre des stratégies politiques sur la santé, d’informer sur les dépenses de santé ou de connaître les différentes prises en charge en santé. L’exploitation des données de ce type peut donner naissance à de nombreuses analyses et de nombreux résultats. 
  • Les données de morbidité : ce sont des données qui sont constituées des dossiers médicaux afin d’effectuer des analyses notamment sur l’évolution d’une ou plusieurs maladies et de prendre les mesures y afférentes. Les maladies les plus prisées sont entre autres le cancer, les maladies cardiovasculaires et les maladies rares. 
  • Les données issues d’enquêtes : ce sont des données qui servent à constituer des bases de données. Ces dernières vont permettre un suivi à plus ou moins long terme. 
  • Les données issues d’une cohorte : une étude de cohorte est un type d’enquête qui permet de suivre dans le temps une population définie, puis de procéder à une comparaison afin de répondre à des questions scientifiques. Les données collectées par ce type d’étude sont nombreuses et sont très diversifiées.

Quels sont les usages et les cas d’applications du Big Data en santé ? 

Le Big Data est utilisé en santé dans divers usages.

Usages courants 

  • Dans la pharmacovigilance : qui a pour objet de surveiller les médicaments et de prévenir les risques d’effets indésirables après leur utilisation. 
  • Dans la prise de décision : les professionnels de santé prennent facilement des décisions par rapport aux données collectées et analysées. 
  • Dans la détection de maladie : l’intelligence humaine peut être limitée et des maladies rares peuvent ne pas être détectées à temps ou ne pas être détectées tout simplement. Grâce aux données, elles peuvent être identifiées et le traitement adéquat peut être mis en place sous un délai considérablement raccourci. 
  • Dans la création de nouveaux produits médicamenteux : le Big Data permet de développer de nouveaux produits, de nouveaux médicaments afin de répondre aux différentes maladies. 
  • Dans l’amélioration des services de soins : le Big Data apporte un grand changement dans l’amélioration des soins auprès des services de santé notamment dans la prise en charge, le suivi, la consultation. 

Usages futurs 

L’utilisation des données ne s’arrêtera pas d’ici peu. Au contraire, elle continuera et deviendra de plus en plus indispensable. Non seulement dans le domaine de la santé mais dans tous les domaines confondus. Retrouvez ci-dessous les différentes utilisations des données que l’on peut s’attendre à retrouver de plus en plus souvent. 

  • Dans la continuité de la liaison entre les centres de soins et les patients, les patients ne devront pas obligatoirement être présents physiquement à l’hôpital pour des petits soins ou des contrôles de santé. 
  • La propagation d’informations  à distance sera améliorée. Le pourcentage de citoyens atteint par les campagnes de prévention augmentera considérablement. Grâce à l’utilisation des données, les professionnels de santé et les différentes institutions pourront améliorer la diffusion dans le but d’éviter tous types de maladies.

Comment le Big Data a révolutionné le domaine de la santé ?  

Utilisation des outils numériques 

Chaque jour, des millions de données de santé circulent, comme les données sur la prévalence et la mortalité des maladies, ou sur l’efficacité des différents traitements ou sur le mode de vie d’un malade. Puis, il y a également des outils d’analyse qui commencent à s’incruster dans le secteur de la santé et créent de nouvelles interactions entre le système de soins et les citoyens. Ces outils répondent à des besoins bien précis. Comme par exemple, Doctolib qui est un logiciel de gestion des rendez-vous et des services aux patients pour les professionnels de santé et également un service de prise de rendez-vous en ligne.  Puis, il y a aussi ces outils qui analysent la voix et les mouvements pour connaître l’évolution de la maladie de Parkinson, ou encore les applications qui permettent aux patients de poser des questions à des robots conventionnels par rapport à des symptômes de maladies bien précis. 

Avantages de l’utilisation des outils numériques

Sur les patients, sur les soignants, les hôpitaux et les centres de soins : ces différents outils aident les centres de soins, les hôpitaux à s’introduire progressivement dans l’ère du numérique. Le fait est que ces derniers ne sont plus en relation avec les patients, une fois qu’ils ne sont plus physiquement présents dans les hôpitaux. Une situation qui peut freiner l’amélioration de la qualité des soins mais surtout avoir des impacts sur le suivi de l’état d’un patient. Raison pour laquelle les centres de soins d’aujourd’hui doivent savoir jongler entre le numérique et la vie réelle.  Une fois que cela sera effectif, les centres de soins, les hôpitaux et également les soignants permettront aux patients de rester connectés même s’ils ne sont pas présents physiquement. Une interaction en continu sera de mise et les patients pourront de temps à autre s’informer sur par exemple les effets secondaires d’un médicament, les différentes préventions de maladie à prendre en compte, etc. 

Sur le monde médical : les outils numériques permettent également au monde médical de s’acquérir des données épidémiologiques et environnementales. Des données importantes dans l’évolution du système de santé traditionnel qui vont par la suite définir les défis à prendre en compte, afin d’améliorer le secteur et de répondre aux besoins ainsi qu’aux attentes des patients et des citoyens. Les données en santé sont alors aujourd’hui nombreuses et aident parfaitement les médecins et surtout les chercheurs, car auparavant, il constituait un blocage sur les différentes recherches effectuées par les chercheurs en santé. 

Prenons des exemples concrets : 

  •  Le cas du Human Genome Project, un projet dans le domaine de la cancérologie qui était composé de deux programmes de séquençage et qui ont permis de générer plusieurs données publiques. Des données qui aident les scientifiques à comprendre ce qu’est le cancer grâce au séquençage du génome complet de plusieurs tumeurs différentes. Puis, les scientifiques partagent ce qu’ils ont pu déterminer sur la maladie et sur le traitement. 
  • Même cas pour les données d’imagerie qui ne cessent de s’améliorer. D’après les statistiques, aux États-Unis, en 2015, plus de 45 millions de scan ont été effectués alors vingt ans plus tôt, le nombre de scan effectué était quatre fois inférieur à cela.

Sur les simples citoyens : à part le monde de la santé et les différents personnels de santé ainsi que les centres de santé, les simples citoyens eux aussi sont également en possession de plusieurs données. Des données qui soit ont été collectées, soit fournies à leur insu à l’aide d’objets connectés portables et des différentes applications qui leur sont liées. Si les données sont collectées ou fournies, pour les traiter, elles doivent avant tout être accessibles. 

Pourquoi est-il intéressant de traiter les données du Big Data ?

Ci-après les raisons qui expliquent le fait qu’il est intéressant de traiter les données du Big Data

Création de nouveaux algorithmes de machine Learning 

Le traitement et l’analyse des données du Big Data sont essentiels car ils ont permis de créer de nouveaux algorithmes de Machine Learning. IBM par exemple a mis en œuvre un projet nommé Watson. Deepmind a également mis en œuvre de son côté un projet de santé. Tous les deux répondent aux grands volumes de données en circulation. Il faut savoir que ces deux grandes entreprises se sont focalisées sur d’autres domaines auparavant, mais aujourd’hui, ont décidé de s’investir dans l’analyse des données concernant la santé publique. 

IBM et Deepmind se concentrent spécialement sur le cancer. Ces deux entreprises d’intelligence artificielle ont investi de puissants moyens afin de mieux répondre aux besoins et aux attentes des citoyens. Des résultats ont déjà été publiés. En 2016, grâce à l’intelligence artificielle, IBM a pu détecter un cas de leucémie jamais détecté par l’intelligence humaine. Watson d’IBM a ainsi prouvé que l’IA utilisée au service de la santé améliorera considérablement les soins donnés aux patients. Une preuve appuyée par l’université de Tokyo qui a affirmé que cette analyse a permis de diagnostiquer et de traiter des patients atteints de cancer. 

Accès au cloud et développement de nouveaux outils 

Auparavant, uniquement les entreprises qui détenaient les outils de pointe avaient accès au cloud et pouvaient développer des outils numériques. Aujourd’hui, avec les prix en baisse mais surtout avec la hausse de leur efficience, leurs usages sont démocratisés. De plus, avec un libre accès au cloud, de nouveaux hébergeurs voient le jour alors qu’auparavant, seuls les grands hébergeurs comme Amazon, Azure ou Google étaient susceptible de se positionner.

Cependant, chaque médaille à son revers. Aussi l’attention est donc de mise pour que les données soient sécurisées de manière adéquate. Pour assurer cette sécurité, l’hébergement des données est uniquement réservé aux personnes en mesure de respecter l’article L.111-8 du Code de la santé publique. Il peut être confié à une personne ayant consenti expressément à l’hébergement de ses données, ayant été agréé pour son activité. Cet hébergeur doit également être soumis à des règles de confidentialité qui sont bien évidemment incluses dans le code de la santé. Ses conditions ne concernent pas notamment les professionnels de santé ou les établissements de santé qui hébergent leurs propres données de santé. Ils ne sont pas soumis à l’agrément et ne sont pas tenus de recueillir le consentement de l’intéressé pour la conservation des données. Par contre, ils sont soumis aux règles de confidentialité.

Partage de données, data challenges 

L’analyse et le traitement des données Big Data ont également donné naissance au partage de données, aux datas challenges et des communautés en ligne ou hors ligne qui se partagent des données autour de la santé. Il y a par exemple Les groupes et les plateformes comme Synapse qui donnent des informations fiables et utiles sur les médicaments. Puis, il y a Kaggle qui est une plateforme web organisant des compétitions en science des données. Les entreprises proposent des problèmes en science des données puis offrent un prix aux spécialistes de données qui obtiennent les meilleures performances. Il y a aussi l’Epidemium qui est un programme de recherche scientifique participatif et ouvert qui se spécialise sur la compréhension du cancer grâce aux Big Data.  Epidemium partage des données et met en ligne les outils nécessaires tout en partageant des savoir-faire et des compétences. Il a également été prouvé que l’ouverture de la santé traditionnelle à d’autres horizons numériques peut amplement révolutionner le domaine de la santé, tout en apportant plusieurs types d’expertises et de résultats.

Quels sont les défis à relever pour obtenir une médecine personnalisée ? 

Selon le Pr Bernard Nordlinger «  Certaines de ces applications se concrétiseront et d’autres non, soit pour des raisons techniques, soit parce que tout progrès est plus hasardeux et difficile quand il concerne l’être humain que le commerce ou le transport en taxi ». Effectivement, aujourd’hui, il n’y a pas encore d’outils ou de plateformes qui ont apporté une amélioration dans la pratique de tous les jours pour le monde de la santé. 

Démocratisation des données 

Est–t-il impossible de penser qu’un jour la médecine soit personnalisée ? Où tout un chacun puisse accéder à des outils numériques qui permettent par exemple de choisir des traitements par rapport aux prédictions des données ? Où tout un chacun puisse considérer des critères variés de génétique ou de mode d’alimentation ? Où tout un chacun puisse dépister sa maladie en se fiant aux données collectées sur les moteurs de recherches ? Il est vrai que nombreuses sont les personnes qui se fient déjà aux données collectées sur les moteurs de recherches, mais tout le monde n’a pas forcément recours à ce type de méthode. La démocratisation des données est alors nécessaire car si les programmes de traitement personnalisés ont déjà été concluants, leurs résultats sont encore confidentiels. 

Invention des systèmes complexes 

Mis à part le passage à la démocratisation des données, il est également nécessaire d’inventer des systèmes complexes qui permettent l’intégration des données de différentes natures, de différentes sources et de différents formats. Les données sont nombreuses et dispersées. Leurs natures peuvent être génomiques, physiologiques, biologiques, sociales et même environnementales.   Leurs formats sont aussi différents. Il y a celles qui sont en format texte, d’autres au format images. Et leurs différences peuvent aussi résider dans les systèmes d’informations. Les informations peuvent provenir des hôpitaux, des bases publiques ou des entreprises privées. En plus d’un système complexe, il faut aussi mettre en place des algorithmes, une grande capacité de stockage et un calcul de bases de données. 

Création de systèmes interopérables 

Face à l’arrivée de telles innovations, les structures de santé ont créé leur propre système de santé. Elles sont alors indépendantes face aux autres types de structures. Ces systèmes ne sont pas interopérables et le partage des données est limité.  Le problème est que si un patient change de centre de santé, ses données ne sont pas automatiquement transmises vers le nouveau centre de santé. Les données peuvent être perdues ou rencontrer des problèmes de format. 

Renforcement de la capacité des citoyens ou le  patient empowerment 

Le patient empowerment est un processus de transformation personnelle par lequel les patients renforcent leur capacité à prendre soin d’eux même et de leur santé. Dans ce cas, il faut expliquer aux citoyens l’importance des données qu’ils ont en leur possession. Ils doivent être conscients de cet avantage, ils doivent comprendre leurs utilités et surtout ils doivent connaître les différents traitements des différentes maladies complexes.  

Miser sur la transparence des informations 

Les institutions doivent faire comprendre quelles sont les données collectées et où elles seront stockées, puis quels seront ses objectifs. Elles doivent jouer la carte de la transparence pour que le grand public puisse comprendre l’intérêt que représentent les données dans les différentes recherches.

Mettre en place un système de protection de données 

 Le fait de collecter des masses de données et de donner confiance aux citoyens concernant le partage de ces données, représente également un grand défi de sécurité. Au le milieu des années 90, les États-Unis ont mis en place Health Insurance Portability and accountability. C’est une loi votée par le Congrès des États-Unis qui concerne la santé et l’assurance maladie. Elle impose la mise en place et la mise en œuvre de mesures de sécurité et de confidentialité dans la création, dans la conservation et dans la transmission des données de santé. L’Union Européenne de son côté a adopté en 1995, la directive qui concerne la protection de données. Par contre, même si des lois sur la protection de données existent, des failles technologiques et des actes malveillants peuvent survenir. Certes, il y a ce qu’on appelle Blockchain qui est un mode de stockage et de  transmission de données sous forme de blocs liés les uns aux autres et protégés contre toute modification. Mais des questions se posent. Le système de santé et cette technologie seront-ils en accord ? Le système de santé est-il prêt à changer son mode de fonctionnement ? 

Pour conclure, avec l’avancée rapide de l’utilisation des Big Data dans divers domaines, il faut cependant accepter que le domaine de la santé ne soit pas encore le domaine qui enregistre la plus forte utilisation des données. Il commence progressivement à les utiliser mais il dispose encore d’une importante marge de progression. Il faut conserver un compromis entre les innovations et leurs usages. Les données sont là pour augmenter l’efficacité des métiers, des traitements ainsi que des préventions par le biais d’une prédiction, d’une réduction des coûts et surtout par la connaissance des maladies. Il ne faut pas s’y méprendre, l’utilisation de la Big Data n’a pas pour objectif de remplacer l’humain en tout point, mais bien d’améliorer l’efficience des processus que ce dernier met en place. Quoiqu’il en soit, implanter le Big Data dans le domaine de la santé prend du temps mais le projet est en cours. Les initiatives existent belles et bien, notamment depuis la crise sanitaire de la Covid-19 mais le retard est aussi là en matière de capacité de traitement et d’analyse des données. Dans ce cas, 4 objectifs doivent être priorisés : la valorisation du patrimoine de données, la facilitation de l’usage des données, la protection des données des citoyens-patients et l’innovation avec l’ensemble des acteurs. Ce qui est sûr, le Big Data bouleverse déjà le domaine de la santé !

Vous souhaitez vous former au Big Data ? Retrouvez les formations Data Full Stack et Data Analyst qui vous forment aux métiers de Data Analyst, Data Scientist, Data Engineer et AI Scientist.
Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data et de l’IA, vous pouvez nous suivre sur FacebookLinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié !