Une nuit agitée est souvent synonyme de fatigue le lendemain, mais elle peut aussi indiquer des problèmes de santé qui ne se manifesteront que bien plus tard. Des scientifiques de Stanford Medicine et leurs collaborateurs ont mis au point un système d’intelligence artificielle capable d’examiner les signaux corporels d’une seule nuit de sommeil et d’évaluer le risque d’une personne pour plus de 100 maladies différentes. Le système, appelé SleepFM, a été entraîné à l’aide de près de 600 000 heures d’enregistrements du sommeil de 65 000 personnes. Ces enregistrements proviennent d’une polysomnographie, un examen approfondi du sommeil qui utilise plusieurs capteurs pour suivre l’activité cérébrale, la fonction cardiaque, les schémas respiratoires, les mouvements des yeux, les mouvements des jambes et d’autres signaux physiques pendant le sommeil.
Les études sur le sommeil contiennent des données sanitaires inexploitées
La polysomnographie est considérée comme l’examen de référence pour l’évaluation du sommeil et est généralement réalisée en laboratoire pendant la nuit. Bien qu’elle soit souvent utilisée pour diagnostiquer les troubles du sommeil, les chercheurs ont reconnu qu’elle permet également de recueillir une multitude d’informations physiologiques qui n’ont pas encore été pleinement analysées. « Nous enregistrons un nombre étonnant de signaux lorsque nous étudions le sommeil », a déclaré Emmanual Mignot, PhD, professeur de médecine du sommeil Craig Reynolds et co-auteur principal de la nouvelle étude publiée dans Nature Medicine. « Il s’agit d’une sorte de physiologie générale que nous étudions pendant huit heures chez une personne qui nous est entièrement confiée. Les données sont très complètes.

Enseigner les habitudes de sommeil à l’IA
Pour obtenir des informations à partir des données, les chercheurs ont développé un modèle de base, un type d’IA conçu pour apprendre des modèles généraux à partir de très grands ensembles de données, puis pour appliquer ces connaissances à de nombreuses tâches. Les grands modèles de langage tels que ChatGPT utilisent une approche similaire, mais ils sont formés sur du texte plutôt que sur des signaux biologiques. SleepFM a été entraîné sur 585 000 heures de données polysomnographiques recueillies auprès de patients examinés dans des cliniques du sommeil. Chaque séance de surveillance du sommeil a été divisée en segments de cinq secondes, qui fonctionnent de manière similaire aux mots utilisés pour former les systèmes d’intelligence artificielle basés sur le langage. Le SleepFM apprend essentiellement le langage du sommeil, a déclaré M. Zou.
Le modèle intègre plusieurs flux d’informations, notamment les signaux cérébraux, les rythmes cardiaques, l’activité musculaire, les mesures du pouls et le flux d’air pendant la respiration, et apprend comment ces signaux interagissent les uns avec les autres. Pour aider le système à comprendre ces relations, les chercheurs ont mis au point une méthode d’apprentissage appelée « Leave-One-Out Contrastive Learning ». Dans cette approche, un type de signal est supprimé à la fois et il est demandé au modèle de le reconstruire à l’aide des données restantes. L’une des innovations techniques réalisées dans le cadre de ces travaux consiste à trouver le moyen d’harmoniser toutes ces modalités de données différentes afin qu’elles puissent s’unir et apprendre le même langage.
Prédire les maladies futures à partir du sommeil
Après la formation, les chercheurs ont adapté le modèle à des tâches spécifiques. Ils l’ont tout d’abord testé dans le cadre d’études standard sur le sommeil, telles que l’identification des stades du sommeil et l’évaluation de la gravité de l’apnée du sommeil. Lors de ces tests, SleepFM a égalé, voire dépassé, les performances des principaux modèles actuels. L’équipe a ensuite poursuivi un objectif plus ambitieux : déterminer si les données relatives au sommeil peuvent prédire des maladies futures. Pour ce faire, elle a relié les enregistrements de polysomnographie aux résultats de santé à long terme des mêmes personnes. Cela a été possible parce que les chercheurs ont eu accès à des décennies de dossiers médicaux provenant d’une seule clinique du sommeil.
Le Stanford Sleep Medicine Center a été fondé en 1970 par le regretté Dr William Dement, PhD, largement considéré comme le père de la médecine du sommeil. Le plus grand groupe utilisé pour former SleepFM comprenait environ 35 000 patients âgés de 2 à 96 ans. Leurs études du sommeil ont été enregistrées à la clinique entre 1999 et 2024 et comparées aux dossiers médicaux électroniques qui ont suivi certains patients jusqu’à 25 ans. Les dossiers de polysomnographie de la clinique remontent encore plus loin, mais uniquement sous forme papier, selon M. Mignot, qui a dirigé le centre du sommeil de 2010 à 2019. À l’aide de cet ensemble de données combinées, SleepFM a passé en revue plus de 1 000 catégories de maladies et a identifié 130 affections qui pouvaient être prédites avec une précision raisonnable sur la base des seules données du sommeil. Les meilleurs résultats ont été obtenus pour le cancer, les complications de grossesse, les maladies circulatoires et les troubles mentaux, avec des valeurs de prédiction supérieures à un indice C de 0,8.
Comment la précision des prédictions est-elle mesurée ?
L’indice C, ou indice de concordance, mesure la capacité d’un modèle à classer les individus en fonction de leur risque. Il indique la fréquence à laquelle le modèle prédit correctement lequel de deux individus connaîtra en premier un événement de santé. « Pour toutes les paires d’individus possibles, le modèle classe les personnes les plus susceptibles de subir un événement – par exemple une crise cardiaque – plus tôt que les autres. Un indice C de 0,8 signifie que la prédiction du modèle correspond à l’événement réel dans 80 % des cas », a expliqué M. Zou. SleepFM a été particulièrement performant dans la prédiction de la maladie de Parkinson (C-index 0,89), de la démence (0,85), de la cardiopathie hypertensive (0,84), de la crise cardiaque (0,81), du cancer de la prostate (0,89), du cancer du sein (0,87) et de la mort (0,84).
Les chercheurs ont été agréablement surpris de constater que le modèle peut faire des prédictions significatives pour un large éventail de maladies différentes. Zou a également souligné que des modèles moins précis, dont l’indice C est souvent d’environ 0,7, sont déjà utilisés dans la pratique médicale, par exemple comme outil pour prédire la réaction des patients à certains traitements contre le cancer.
Comprendre ce que voit l’IA
Les chercheurs s’efforcent à présent d’améliorer les prédictions de SleepFM et de mieux comprendre comment le système parvient à ses conclusions. Les versions futures pourraient intégrer des données provenant de dispositifs portables afin d’élargir la gamme des signaux physiologiques. « Le système ne nous explique pas les choses avec des mots », a déclaré Zou. « Mais nous avons mis au point diverses techniques d’interprétation pour comprendre ce que le modèle observe lorsqu’il prédit une maladie particulière.
L’équipe a constaté que si les signaux liés au cœur avaient un impact plus important sur la prédiction des maladies cardiovasculaires et que les signaux liés au cerveau jouaient un rôle plus important dans la prédiction de la santé mentale, les résultats les plus précis provenaient de la combinaison de tous les types de données. « La plupart des informations que nous avons obtenues pour prédire les maladies provenaient de la comparaison des différents canaux », a déclaré M. Mignot. Les composants physiques qui ne sont pas synchronisés, comme un cerveau endormi mais un cœur éveillé, semblent annoncer des problèmes. Rahul Thapa, doctorant en science des données biomédicales, et Magnus Ruud Kjaer, doctorant à l’université technique du Danemark, sont les coauteurs de l’étude. Des chercheurs de l’université technique du Danemark, de l’hôpital universitaire de Copenhague Rigshospitalet, de BioSerenity, de l’université de Copenhague et de la Harvard Medical School ont contribué à ces travaux.








