Qu’est-ce que l’Entrepôt de Données de Santé (EDS) ?

L’Entrepôt de Données de Santé (EDS) de l’AP-HP intègre les données administratives et médicales de plus de 8 millions de patients hospitalisés ou venus en consultation dans les 39 établissements de l’AP-HP.

L’EDS permet de multiplier les usages autour des données massives en santé. Il représente une opportunité :

– pour faire avancer la recherche scientifique dans le domaine de la santé en facilitant la réalisation de recherches multicentriques n’impliquant pas la personne humaine, des études de faisabilité d’essais cliniques et le développement d’algorithmes d’« intelligence artificielle » (IA)

– pour améliorer le pilotage de l’activité hospitalière

L’EDS fait l’objet d’une gouvernance spécifique associant des professionnels de santé, des chercheurs et des représentants de patients.

Sur le plan réglementaire, la constitution de l’EDS a été autorisée par la CNIL le 19 janvier 2017 et une déclaration de conformité à la méthodologie de référence CNIL concernant les recherches n’impliquant pas la personne humaine a été réalisée.

Face aux enjeux éthiques et sociétaux soulevés par la constitution de l’EDS, des règles pour l’accès à l’EDS et l’utilisation de ses données ont été élaborées et approuvées en septembre 2016 par la Commission Médicale d’Établissement, le Directoire et la Direction générale de l’AP-HP. Un Comité Scientifique et Ethique (CSE) a été créé en décembre 2016 avec pour mission principale l’évaluation scientifique, réglementaire et éthique des projets de recherche multicentrique.

Une plateforme sécurisée, performante, dotée des capacités de stockage et d’analyse dimensionnées pour les usages attendus a été mise en place. Les solutions i2b2 et Jupyter, cette dernière étant dédiée à l’analyse de données massives, permettent de construire des environnements de travail sécurisés avec les données mises à disposition pour chaque projet de recherche. La solution IBM Cognos, dédiée au pilotage de l’activité hospitalière est en cours de déploiement.

Afin de favoriser le développement d’applications d’IA, l’AP – HP se mobilise en organisant des évènements d’ampleur. Le « datathon » DAT-ICU qui s’est tenu en janvier 2018, en lien avec le MIT lab for Computational Physiology a réuni plus de 150 médecins et data-scientists autour de l’infrastructure EDS et de la base de données ouverte MIMIC (données de santé de patients admis en réanimation aux États-Unis). La rencontre entre les chercheurs de l’Inria et de CentraleSupélec et les médecins de l’AP-HP s’est déroulée le 12 novembre 2018 et a réuni plus de 100 participants permettant aux professionnels de santé de croiser leurs expertises médicales, chirurgicales et en biologie médicale avec les expertises en neurosciences, mathématiques et biologie systémique des chercheurs de l’Inria et de CentraleSupelec. La rencontre a également permis de faire émerger des sujets d’intérêts communs parmi lesquels des projets d’aide à la décision médicale et des projets d’amélioration des parcours de soins ville-hôpital.

Les usages de l’EDS se développent progressivement : plus de 7500 requêtes ont été réalisées via i2b2 dans plus de 150 services des établissements de l’AP-HP et près de 40 projets de recherche multicentrique ont été soumis à l’avis du Comité Scientifique et Ethique, parmi lesquelles des projets d’IA en santé avec développement d’algorithmes prédictifs, algorithmes d’aide au dépistage ou d’aide à la prise de décision médicale en cancérologie, en neurologie, en réanimation, ou encore dans le domaine du codage de l’activité hospitalière. Des projets de développement d’algorithmes de traitement automatique des langues pour exploiter les données des comptes rendus médicaux ont également été soumis à l’avis du CSE. Des études de faisabilité d’essais cliniques seront également réalisées. Enfin plus de 10 tableaux de bords de pilotage de l’activité hospitalière seront réalisés (dans les domaines de l’identito-vigilance, des documents de sortie pour la continuité des soins, de l’imagerie et de la prescription informatisée de biologie, d’imagerie et de soins).

Chiffres clés (12/2018) : Données de 8,8 millions de patients, > 150 équipes de soins utilisatrices de l’EDS (315 utilisateurs, > 7500 requêtes), 30 projets de recherche multicentrique sur données ayant reçu un avis favorable du CSE.