Le big data permettra-t-il de vaincre le cancer ?

L’explosion des données patients pourrait permettre l’optimisation de la prise en charge du cancer, mais le big data se heurte encore à des défis logistiques colossaux.

 

Le cancer est l’un des fléaux de notre époque. Principale cause mondiale de décès, il était responsable de la mort de 10 millions de personnes en 2020. Sa prévalence est en augmentation : le nombre de nouveaux cas devrait augmenter d’environ 70 % au cours des vingt prochaines années.

 

Bien que la lutte contre le cancer progresse à grands pas depuis trente ans, permettant ainsi de doubler le taux de survie, un remède universel reste utopique.

 

Le cancer n’est pas une maladie unique, mais un terme générique désignant des centaines de maladies différentes. Chaque tumeur cancéreuse est différente. Chacune d’elle croît et se développe de manière incontrôlée. Une seule tumeur peut contenir des milliards de cellules, ayant la capacité de se modifier, de muter et de générer de nouvelles variations génétiques en se divisant, au gré de la croissance et du développement de la tumeur. Il peut donc exister un grand nombre de variations au niveau du génome tumoral.

 

En conséquence, la guérison du cancer est donc très complexe et les oncologues, spécialistes du traitement du cancer, ont pour mission d'arrêter une cible en perpétuelle évolution. Il n’existe pas de solution universelle.

 

« Le cancer est extrêmement hétérogène, » explique le Dr Andreas Schuppert, professeur à la RWTH Aachen University et spécialiste de Clinical Pharmacometrics pour la division Pharmaceuticals de Bayer. « Si l’on compare les cancers au niveau moléculaire, il est presque impossible de trouver deux cancers similaires. Le problème est le suivant : personne ne sait précisément quels paramètres contrôlent l’évolution du cancer. C’est là une des difficultés. »

Des connaissances capables de changer la vie d’un patient ou de changer le monde se cachent dans cette multitude de données.
Atul Butte
,
Directeur de l’Institut de sciences médicales quantitatives, UCSF

Une montagne de données

Les chercheurs ne manquent pas de données. Un seul patient atteint d’un cancer peut générer près d’un téraoctet de données biomédicales, composées de données diagnostiques générales et de données cliniques propres au patient. Ce volume stocké équivaut à 300 000 photos ou 130 000 livres.

 

En plus des antécédents des patients et des données d’imagerie diagnostique, les données génétiques sont aujourd’hui un outil clé dans la lutte contre le cancer. Le coût du séquençage d’ADN ayant chuté depuis 20 ans, réunir des informations génétiques détaillées sur le patient et sur la tumeur est devenu beaucoup plus accessible, ce qui augmente le volume de données disponibles pour les scientifiques.

 

Aujourd’hui, les chercheurs ne se contentent pas d’examiner le code génétique des cellules cancéreuses qui sont à l’origine de la maladie. Ils peuvent également les comparer à l’ADN des métastases, ou tumeurs secondaires, qui se développent à distance, et ainsi mesurer les évolutions génétiques des cellules cancéreuses originelles.

 

À la fin de l'année 2017, on estimait que les recherches portant sur le séquençage du génome des patients avaient généré un volume d'un exaoctet de données annuelles, soit un million de téraoctets (l’équivalent de 130 milliards de livres, soit mille fois plus que le nombre de livres jamais publiés).

 

« Des connaissances capables de changer la vie d’un patient ou de changer le monde se cachent dans cette multitude de données. » – Atul Butte, Directeur de l’Institut de sciences médicales quantitatives, UCSF.

Des chercheurs stockent des échantillons de tumeurs dans de l’azote liquide.

Comment les scientifiques utilisent les données pour combattre le cancer

La nature extrêmement complexe des cancers, la stratégie d’utilisation du big data est très différente de la stratégie mise en œuvre pour d’autres types de maladies. Dans le cas des cancers, il peut y avoir plusieurs milliers de paramètres par patient, mais parfois seulement quelques patients similaires à étudier, car chaque tumeur est unique.

 

Les chercheurs utilisent actuellement ces données pour analyser la maladie à trois niveaux :

 

  • Cellule – Analyse des données individuelles des cellules cancéreuses et mise en évidence de biomarqueurs génétiques. La découverte de ces particularismes pourrait nous aider à prédire ces modifications génétiques et adapter l’approche thérapeutique.

  • Patient – Les antécédents médicaux du patient et les données relatives à son ADN pourraient être utilisés pour définir la meilleure association thérapeutique pour ce patient, en fonction de la tumeur, de ses gènes, et des effets des traitements sur des patients présentant des pathologies et des caractéristiques génétiques similaires

  • Population – Des données couvrant une plus grande population peuvent être analysées et servir de base aux stratégies thérapeutiques destinées aux patients, en fonction de leur mode de vie, leur situation géographique et les types de cancers.

 

L’objectif final de ces diverses stratégies est de permettre aux oncologues de fournir à chaque patient un traitement médical personnalisé ciblant ses cellules cancéreuses spécifiques, tout en limitant le risque d'effets secondaires graves.

 

Symptômes et superordinateurs

« Le big data existe depuis longtemps en médecine. Les trois V (volume, vélocité et variété) détermineront de plus en plus la réalité quotidienne des cabinets médicaux, » déclare le Dr Joerg Lippert, Chef du service Clinical Pharmacometrics au sein de la division Pharmaceuticals de Bayer.

 

L’analyse de données est d’ores et déjà un outil clé dans la lutte contre la maladie à l’ère numérique. Mais pour le cancer, le caractère imprévisible de la mutation et du développement de la tumeur vient compliquer la recherche d’une réponse dans toutes ces données.

 

Le défi réside moins dans l’accumulation de données relatives aux patients que dans la capacité à les gérer correctement et les analyser efficacement. Il n’existe pas plus de remède universel pour le cancer qu’il n’existe d’outil unique pour analyser les données. Les chercheurs et les informaticiens doivent constamment se remettre à la page. À peine ont-ils conçu les nouveaux outils et les nouvelles techniques nécessaires au traitement efficace de toutes ces informations, que de nouvelles sources de données apparaissent et que les exigences en matière de puissance de calcul augmentent.

 

Et il ne faudrait pas oublier la question de la normalisation et des méthodes de collecte, de stockage et d’étude des données. La génomique ne compte pas encore de normes de conversion des séquences de données brutes en données traitées, alors que certaines données médicales sont très peu structurées voire, parfois inexactes, en raison d’erreurs humaines lors de la saisie ou lors de la mesure et de l’enregistrement.

 

Pour traiter ce volume de données personnelles, développer des outils logiciels permettant de leur donner un sens, et disposer de la puissance de supercalcul nécessaire pour tout traiter, les chercheurs misent de plus en plus sur les stratégies collaboratives. Les projets publics-privés, tels que l’Innovative Medicines Initiative, en Europe, permettent d’accélérer le processus de développement et de réunir différentes compétences. L’initiative Project Data Sphere est une plateforme destinée au partage, à l’intégration et à l’analyse des données issues d’études historiques sur le cancer en un seul endroit. Le DREAM Challenges, quant à lui, est un projet de science ouverte qui s’appuie sur le crowdsourcing et le partage transparent des données pour évaluer les outils d’analyse existants, suggérer des améliorations et concevoir de nouvelles solutions. La législation sur la protection des données personnelles est aussi nécessaire pour encadrer ces recherches, et rajoute un paramètre de plus dans cette situation déjà complexe.

 

Le pouvoir du savoir collectif

Les montagnes d’informations auxquelles ont aujourd’hui accès les oncologues pourraient les aider à élaborer des traitements personnalisés capables de mieux cibler les tumeurs et de réduire les effets secondaires potentiels pour les patients.

 

Mais cette tâche est d’une extrême difficulté ; exploiter le potentiel réel de cette nouvelle arme dans la lutte contre le cancer nécessite une gestion et une analyse efficaces de l’ensemble des données. La solution réside dans une meilleure collaboration, dans un travail commun permettant d’utiliser plusieurs outils ayant chacun pour rôle d’examiner des caractéristiques spécifiques.

 

Si la médecine du 20e siècle portait sur la quête de données, le 21e siècle porte sur la coopération qui permettra de mieux les utiliser.

 

Le monde change et nous devons trouver maintenant des solutions pour préserver notre santé, notre alimentation et notre planète. Parce que mieux vivre, c'est possible !

 

PP-OTH-FR-0037-1

7 min read