Données en cancérologie : de la plateforme de données au registre national
iStock-2149721556
Le Parlement a définitivement adopté la proposition de loi pour créer un registre national des cancers, dans les mêmes termes que le Sénat deux ans plus tôt. Il vise à constituer une base de données homogènes couvrant l’ensemble de la population française.
Déposée en avril 2023 au Sénat et adoptée à l’unanimité le 15 juin 2023, la proposition de loi visant à créer un registre national du cancer attendait depuis son passage à l’Assemblée Nationale. C’est chose faite avec une adoption, là aussi unanime par les députés, depuis le 23 juin. Un projet qui s’appuiera notamment sur la plateforme de données en cancérologie hébergée par l’InCA.
Qu’est-ce que la plateforme de données en cancérologie de l’INCa ?
La plateforme en cancérologie de l’INCa est un projet né dans les années 2010. La cohorte de départ et les objectifs ont évolué au fur et à mesure des années. Elle vise à présent à répondre aux multiples enjeux autour de la cancérologie et des questions de santé publique : épidémiologie, développement de traitements en lien avec l’industrie pharmaceutique, développement de modèles d’IA, cancers et environnement, création d’indicateurs de routine etc
Une plateforme récemment finalisée
Si le projet et les premières applications datent de plus de 10, la forme finalisée de la plateforme est récente. La cohorte d’origine s’appuyait sur une extraction du SNDS pour toutes les personnes a priori atteinte d’un cancer (c’est-à-dire dont le dossier comportait une hospitalisation mentionnant le code « cancer », des radiothérapies en secteur libéral, des remboursements de médicaments anti-cancéreux, une ALD pour cancer, ou certains actes spécifiques d’anatomopathologie). Cette cohorte grandit chaque année et comporte aujourd’hui environ 12 millions de patients.
Elle est mise à jour en fin d’année n+1 et la profondeur d’historique autorisée est de 20 ans.
« L’outil étant un peu complexe à manipuler, nous mettons à disposition des utilisateurs des tables d’extraction qui peuvent être enrichies de certains éléments », précise Christine Le Bihan, responsable du département « données et évaluation en santé » de l’INCa lors d’un webinaire de juin dédiée à la plateforme et à son fonctionnement (Replay disponible sur Youtube)
De nouvelles sources
En 2019, les sources ont été élargies aux registres des cancers (27 à ce jour) qui couvrent moins de 25 % du territoire. « L’avantage par rapport aux seules données du SNDS c’est que les cas de cancers sont confirmés et que l’on a accès aux données de l’histologie avec par exemple les détails sur le stade du cancer. Nous avons ensuite eu l’autorisation d’accéder aux données des centres régionaux de coordonation des dépistages mais ils ont connu une refonte de leur périmètre si bien que les données ne sont pas encore intégrées dans la plateforme. Depuis 2023, nous avons l’autorisation d’intégrer des éléments du dossier de soin tels que des CR de RCP, la base OSCOUR, les CR d’anatomopathologie ainsi que des données du monde académique ou industriel issues d’études cliniques par exemple. » ajoute l’experte.
La plateforme n’est pas qu’un EDS
Ces données doivent être ensuite appariées car il n’y a pas d’identifiant commun entre les différentes sources de données. Tous ces appariements sont en cours d’intégration. Et plusieurs études sont lancées pour les valider et les mettre en pratique sur le terrain sur de premières études de cas.
Un autre travail est celui de l’anonymisation de toutes ces données pour qu’elles puissent être utilisées par la recherche tant académique qu’industrielle.
La plateforme de l’InCA n’est donc pas seulement un entrepôt de données de santé (EDS), mais véritablement un système d’information complet où les données sont chaînées, triées pour les mettre à disposition de manière opérationnelle. Et c’est un outil dynamique qui se construit tous les jours.Des travaux sont par exemple engagés pour créer des outils de datavisualisation intégrés, des moteurs de recherches basé sur des LLM. L’enjeu aussi réside aussi dans la communication de données entre différents EDS autour de la cancérologie. Afin qu’ils puissent être plus facilement intéropérables. Cela prendra certainement des années.
Le travail avec les registres locaux
Dans cette optique de converger vers des formats de collecte commun des données, un travail a été entamé avec les registres locaux afin que l’INCa mettent à leur disposition un système d’information commun. « Nous espérons le voir mis en place en 2026« , précise Christine le Bihan. Ce que les députés ont voté c’est la création d’un registre national. Il s’appuiera sur la plateforme de l’InCA mais de nombreux obstables techniques et réglementaires sont encore à mesurer et à passer.



