Une nuit agitée entraîne souvent de la fatigue le lendemain, mais elle peut également être le signe de problèmes de santé qui ne se manifesteront peut-être que beaucoup plus tard. Des scientifiques de Stanford Medicine et leurs collaborateurs ont mis au point un système d’intelligence artificielle capable d’examiner les signaux corporels enregistrés pendant une seule nuit de sommeil et d’évaluer le risque d’une personne de développer plus de 100 maladies différentes. Ce système, appelé SleepFM, a été entraîné à partir de près de 600 000 heures d’enregistrements du sommeil de 65 000 personnes. Ces enregistrements proviennent de la polysomnographie, un test approfondi du sommeil qui utilise plusieurs capteurs pour suivre l’activité cérébrale, la fonction cardiaque, les schémas respiratoires, les mouvements oculaires, les mouvements des jambes et d’autres signaux physiques pendant le sommeil.
Les études sur le sommeil contiennent des données de santé inexploitées
La polysomnographie est considérée comme la référence en matière d’évaluation du sommeil et est généralement réalisée pendant la nuit dans un laboratoire. Bien qu’elle soit souvent utilisée pour diagnostiquer les troubles du sommeil, les chercheurs ont reconnu qu’elle permettait également de recueillir une multitude d’informations physiologiques qui n’ont pas encore été entièrement analysées. « Nous enregistrons un nombre impressionnant de signaux lorsque nous étudions le sommeil », a déclaré le Dr Emmanual Mignot, PhD, professeur Craig Reynolds de médecine du sommeil et co-auteur principal de la nouvelle étude publiée dans Nature Medicine. « Il s’agit d’une sorte de physiologie générale que nous étudions pendant huit heures chez une personne qui est entièrement sous notre surveillance. Les données sont très complètes. »

Enseigner les modèles de sommeil à l’IA
Afin de tirer des enseignements de ces données, les chercheurs ont développé un modèle de base, un type d’IA conçu pour apprendre des modèles généraux à partir de très grands ensembles de données, puis appliquer ces connaissances à de nombreuses tâches. Les grands modèles linguistiques tels que ChatGPT utilisent une approche similaire, mais ils sont entraînés sur du texte plutôt que sur des signaux biologiques. SleepFM a été entraîné sur 585 000 heures de données polysomnographiques collectées auprès de patients examinés dans des cliniques du sommeil. Chaque session de surveillance du sommeil a été divisée en segments de cinq secondes, qui fonctionnent de manière similaire aux mots utilisés pour entraîner les systèmes d’IA basés sur le langage. SleepFM apprend essentiellement le langage du sommeil, explique M. Zou.
Le modèle intègre plusieurs flux d’informations, notamment les signaux cérébraux, les rythmes cardiaques, l’activité musculaire, les mesures du pouls et le débit d’air pendant la respiration, et apprend comment ces signaux interagissent entre eux. Pour aider le système à comprendre ces relations, les chercheurs ont mis au point une méthode d’entraînement appelée « apprentissage contrastif Leave-One-Out ». Dans cette approche, un type de signal est supprimé à la fois et le modèle est invité à le reconstruire à l’aide des données restantes. L’une des innovations techniques qu’ils ont réalisées dans le cadre de ces travaux consiste à trouver comment harmoniser toutes ces différentes modalités de données afin qu’elles puissent se réunir et apprendre le même langage.
Prédire les maladies futures à partir du sommeil
Après la formation, les chercheurs ont adapté le modèle à des tâches spécifiques. Ils l’ont d’abord testé dans le cadre d’études standard sur le sommeil, telles que l’identification des phases de sommeil et l’évaluation de la gravité de l’apnée du sommeil. Lors de ces tests, SleepFM a égalé, voire surpassé, les performances des modèles leaders actuels. L’équipe s’est ensuite fixé un objectif plus ambitieux : déterminer si les données sur le sommeil peuvent prédire les maladies futures. Pour ce faire, ils ont mis en relation les enregistrements polysomnographiques avec les résultats de santé à long terme des mêmes personnes. Cela a été possible grâce à l’accès des chercheurs à des décennies de dossiers médicaux provenant d’une seule clinique du sommeil.
Le Stanford Sleep Medicine Center a été fondé en 1970 par le regretté Dr William Dement, PhD, largement considéré comme le père de la médecine du sommeil. Le plus grand groupe utilisé pour former SleepFM comprenait environ 35 000 patients âgés de 2 à 96 ans. Leurs études sur le sommeil ont été enregistrées à la clinique entre 1999 et 2024 et mises en correspondance avec des dossiers médicaux électroniques qui ont suivi certains patients pendant 25 ans. Les enregistrements polysomnographiques de la clinique remontent à encore plus loin, mais uniquement sous forme papier, selon Mignot, qui a dirigé le centre du sommeil de 2010 à 2019. À l’aide de cet ensemble de données combinées, SleepFM a examiné plus de 1 000 catégories de maladies et identifié 130 affections pouvant être prédites avec une précision raisonnable sur la base des seules données relatives au sommeil. Les meilleurs résultats ont été obtenus pour le cancer, les complications de grossesse, les maladies circulatoires et les troubles mentaux, avec des valeurs de prédiction supérieures à un indice C de 0,8.






