Le domaine de la recherche en santé a considérablement évolué ces dernières années. Tout cela est dû en grande partie au Big Data. Désormais, les scientifiques ont à leur disposition des données massives qui leur permettent de mieux appréhender l’évolution d’une maladie. Le Big Data vient en aide à la science, à tous les niveaux. Il apporte son aide dans l’identification des facteurs de risque d’une maladie. Il peut aussi être un outil de diagnostic des cancers ou dans les choix du traitement le plus pertinent. Il peut aussi aider les scientifiques dans la surveillance d’agents pathogènes.
Comment le Big Data a révolutionné la recherche en santé ?
Grâce au Big Data, les scientifiques ont à leur disposition un flux massif et constant d’informations. Il est humainement impossible de traiter rapidement ces données, mais grâce aux évolutions technologiques, il est possible d’automatiser le traitement de ces données. Cela permet d’obtenir un résultat rapide, mais, surtout, plus fiable. Comment cela se passe-t-il dans la réalité ? Pour mieux comprendre, l’idéal est de prendre des exemples.
La génomique, plus accessible grâce au big data
L’incroyable avancée apportée en médecine par le big data concerne sans aucun doute la génomique. En 2003, des recherches ont permis la réalisation du premier séquençage génomique humain. Soit une écriture de nos 23 000 gènes. C’est le fruit de près de 15 ans de travaux et qui a coûté près de 3 milliards de dollars. Aujourd’hui, grâce au Big Data, séquencer le génome humain ne prend qu’une journée. Et le coût a considérablement baissé, puisqu’il faut à peine 1000 dollars pour réaliser l’opération.
Ce coût réduit a permis d’introduire le séquençage génomique dans les études concernant plusieurs maladies. Auparavant, le généticien devait se contenter d’un échantillonnage de gènes de quelques patients pour effectuer les recherches. Aujourd’hui, il peut accéder à des séquences de gènes complètes de nombreux patients. Ces données, associées à d’autres informations relatives aux patients comme l’âge, le sexe ou encore les antécédents médicaux, permettent de mieux appréhender l’évolution de la maladie. Ces données sont particulièrement intéressantes dans l’étude de l’autisme, du cancer ou de certaines maladies neurodégénératives. Concrètement, comment cela se passe-t-il ? Pour vérifier si un traitement est efficace, le praticien peut comparer les génomes de patients répondant au traitement à ceux de ceux qui n’y répondent pas. L’objectif est de voir s’il y a des différences génétiques entre ces personnes. Cela permet d’identifier les marqueurs génétiques pour lesquels un traitement peut s’avérer inefficace.
Cette comparaison est un travail titanesque qui n’est pas humainement réalisable. Grâce aux avancées technologiques liées au traitement des données engrangées par le Big Data, ce traitement est facilité. Grâce à l’aide data scientists, les généticiens disposent d’un outil informatique permettant d’automatiser la grande partie du travail de comparaison. Ces outils ont été élaborés par des bio-informaticiens et statisticiens et autres spécialistes, grâce à des programmes et des algorithmes informatiques.
Nous parlons tout le temps de génome humain, mais cette avancée dans la génomique s’étend aussi aux génomes des virus et bactéries. Le Big Data permet aussi une avancée considérable en ce qui concerne la métagénomique. En d’autres termes, il est plus facile d’étudier le microbiote intestinal, grâce à l’étude de l’ADN contenu dans l’échantillon des selles. En quoi cela est-il nécessaire ? Notre flore intestinale contiendrait pas moins de 100 000 espèces de microbes dont la composition varie en fonction de l’individu. Ces microbes ont pourtant une influence non négligeable sur notre état de santé. Leur étude permet aussi de détecter quels virus sont les plus menaçants pour la santé.
Tout cela nous amène à l’autre avancée majeure en santé, rendue possible grâce à la contribution du Big Data.
Des agents pathogènes facilement identifiables
Grâce au Big Data, il devient plus simple de surveiller l’évolution de maladies infectieuses et détecter l’apparition d’une épidémie telle que la grippe, les infections alimentaires, les rages ou les méningites. Le programme PIBnet de l’Institut Pasteur répertorie chaque année les génomes des souches virales et bactériennes isolées de patients atteints d’une maladie infectieuse en France. Ces souches sont séquencées sur une plateforme et les résultats sont conservés. La France dispose ainsi pour chaque virus et bactérie, une information sur sa provenance, sa virulence, sa présence sur le territoire et son niveau de résistance. Cette base de données est importante et peut être combinée avec d’autres informations issues d’autres pays. Cela permet de détecter la diffusion d’agents pathogènes sur le plan international. Grâce à ces données, il a été plus simple d’appréhender la récente pandémie de la Covid-19.
Une imagerie médicale plus rapide à interpréter
Le Big Data a aussi révolutionné le monde de l’imagerie médicale. Des microscopes puissants et automatisés ont vu le jour. Le plus puissant est Titan Krios. Il est en mesure de fournir en une heure des images dont la quantité est équivalente au volume de 500 films vidéos en haute définition. Une telle quantité d’informations est difficilement traitable par le cerveau humain. Le développement en matière de science de données a permis l’analyse rapide de ces images.
La combinaison de l’IA ou intelligence artificielle et du deep learning permet désormais d’analyser ces images à la place du médecin spécialiste. Des études récentes menées par une équipe américaine ont permis de démontrer la pertinence du Big Data en matière d’imagerie médicale. Un ordinateur a été entraîné à diagnostiquer des mélanomes déjà reconnus bénins ou malins. On a ensuite comparé sa performance avec celle de 58 médecins spécialisés issus de 17 pays différents. Le résultat a été sans appel. Dans la majeure partie des cas, l’ordinateur a fait mieux que le dermatologue. Les chercheurs ont fait en moyenne 87 % de bons diagnostics contre 95 % pour l’ordinateur.
Un ordinateur bien performant peut ainsi être d’une grande utilité au praticien. Il permettrait d’interpréter rapidement toutes sortes d’images médicales (scanners, radios), réduisant ainsi considérablement les risques d’erreurs de diagnostic liées à un coup de fatigue ou une perte de concentration.
Quelles peuvent être les applications du Big Data en médecine ?
Nous avons vu tout à l’heure que le Big Data permet de mieux prévenir et prendre en charge les maladies. Les données recueillies permettent en effet d’élaborer des outils d’aide au diagnostic. Cela permet aussi de faciliter le suivi de l’efficacité d’un médicament et d’évaluer les risques qu’il représente. Grâce au Big Data, il devient aussi plus simple de prévenir l’apparition d’une épidémie. Le domaine d’application du Big Data en médecine ne s’arrête pas là.
Une médecine de plus en plus personnalisée
Grâce au Big Data, récolter les données médicales d’un patient relève du jeu d’enfant. Ces données peuvent être récupérées par les professionnels de santé lors de l’examen du dossier médical ou grâce aux essais cliniques et analyses de l’ADN. Le patient lui-même peut fournir ces données grâce à l’utilisation d’objets connectés et d’applications mobiles. Désormais, le praticien dispose d’informations pertinentes qui lui permettent de personnaliser au mieux le suivi et la prise en charge d’un patient.
À titre d’exemple, dans le CHU de Caen, depuis 2005, les personnes atteintes d’une maladie cardiaque remplissent un questionnaire sur l’évolution de ses symptômes, son alimentation, son activité physique. Les réponses orientent le praticien sur la meilleure prise en charge possible.
Une recherche médicale plus accélérée
L’accès au Big Data accélère les procédures de recherche. Dorénavant, il n’est plus nécessaire de passer par la phase fastidieuse d’étude de dossiers, de sélection de patient et de diagnostic pour mettre en place un essai clinique. Grâce aux applications privilégiant la communication instantanée, le praticien obtient en temps réel les informations dont il a besoin pour étudier l’évolution de la maladie et ajuster le traitement.
Le projet mPower sur la maladie de Parkinson est la parfaite illustration de cette révolution. Les patients partagent leurs symptômes aux chercheurs via une application. Les déviations de la voix et de la marche, le niveau de dextérité, tout peut être analysé via cette application. Les résultats permettent aux scientifiques d’affiner leur recherche et d’ajuster leur traitement. Dans le futur, le patient ne sera plus obligé de se rendre à l’hôpital pour subir des tests, ce qui est moins contraignant.
Le Big Data révolutionne le monde de la médecine. Le défi pour le chercheur d’aujourd’hui est de trouver des données pertinentes. Où les trouver ? Elles sont la plupart du temps dans des entrepôts numériques consultables sur internet. Voici quelques exemples de ces bases de données.
Quelles sont les sources où rechercher des données fiables en épidémiologie ?
Il existe plusieurs sources fiables sur internet où on pourrait consulter des données relatives à l’épidémiologie.
- Santé Publique France
En France, il s’agit de la principale source d’informations en matière d’épidémie. Sa principale mission consiste à surveiller l’état de santé de la population en assurant une veille épidémiologique. On retrouve sur le site les bilans des maladies à déclaration obligatoire ainsi que les rapports annuels sur les différentes épidémies.
- L’Observatoire de la médecine générale
Le site de l’Observatoire de la médecine générale a été mis en ligne depuis 2004. Il a été fondé par la Société française de Médecine générale. Les données présentées sur ce site sont recueillies par plus d’une centaine de médecins sur une période de dix ans et portent ainsi sur plus de deux millions de consultations.
- Le réseau Sentinelle de l’unité U444 de l’INSERM
Le réseau a mis en place Sentiweb-Hebdo, un bulletin hebdomadaire relatant les actualités des épidémies en France, mais aussi des différentes maladies observées par le réseau Sentinelle. Le site met aussi à disposition du public des cartes et des tableaux de données sur une épidémie en particulier.
- Score Santé
Outre les sources nationales, il y a des sources régionales qui permettent de suivre l’évolution d’une épidémie sur une région donnée. Score Santé est l’une des principales sources d’informations régionales. C’est une référence en matière d’indicateur de santé. Il met à disposition des informations fiables, homogènes et surtout comparables sur l’état de santé de la population. Les informations sont catégorisées en trois niveaux : les indicateurs régionaux, les indicateurs départementaux et infra départementaux (les données sont plus détaillées), et enfin, les données abrégées sur certains thèmes spécifiques.
- EPINORTH
EPINORTH est une autre source d’informations sur l’épidémiologie. Elle assure la surveillance épidémiologique de cinq pays européens, de trois républiques baltiques et de cinq pays de l’ouest des territoires russes. Les données relatives à l’évolution des épidémies dans cette région depuis 1999 à nos jours sont disponibles sur le site d’EPINORTH.
- Le PHLS ou Public Health Laboratory Services
Il est chargé d’assurer la veille épidémiologique en Grande-Bretagne. Son rôle est de diagnostiquer, et de diffuser les informations sur les maladies contagieuses qui se trouvent sur le territoire britannique.
- Le DGSPSP ou Direction générale de la Santé de la population et de la santé publique
Ce site publie des actualités en bref pour les maladies infectieuses. Cet abrégé hebdomadaire contient des informations canadiennes et internationales sur les maladies transmissibles.
Il ne s’agit pas là d’une liste exhaustive de toutes les sources d’informations en matière d’épidémiologie. Il y en existe d’autres, mais celles-ci sont les plus pertinentes. D’autres sources également, se spécialisent dans une pathologie en particulier.
Prenons l’exemple de la grippe, parce qu’elle est la plus proche de la pandémie que nous venons de vivre ces dernières années. Vous trouverez des informations sur la situation de la grippe en France sur le site du Réseau national des GROG ou Groupes Régionaux d’information sur la Grippe. Le Groupe d’étude et d’information sur la grippe ou GEIG recueille et analyse les informations sur la grippe en vue de prévenir la propagation de la maladie.
Au-delà de tous ces sites, il existe des revues spécialement dédiées à l’épidémiologie. Ils peuvent être une source d’informations. En France, le Ministère du Travail et des Affaires sociales ainsi que la direction générale de la Santé publient une revue sur l’évolution des épidémies en France.
Encore une fois, toutes ces données, aussi pertinentes soient-elles, ne peuvent pas être utiles si elles ne sont pas analysées et catégorisées. Elles sont tellement massives qu’un cerveau humain ne serait pas en mesure de les traiter rapidement. C’est là que les spécialistes en analyse de données entrent en jeu, en élaborant des algorithmes permettant de mieux interpréter.
Vous souhaitez vous former au Big Data ? Retrouvez les formation Data Full Stack et Data Analyst qui vous forment aux métiers de Data Analyst, Data Scientist, Data Engineer et AI Scientist.
Merci pour votre lecture ! Si vous souhaitez lire nos prochains articles autour de la Data et de l’IA, vous pouvez nous suivre sur Facebook, LinkedIn et Twitter pour être notifié lorsqu’un nouvel article est publié !