En orolig natt leder ofta till trötthet nästa dag, men det kan också tyda på hälsoproblem som kanske inte uppstår förrän långt senare. Forskare vid Stanford Medicine och deras samarbetspartners har utvecklat ett system med artificiell intelligens som kan undersöka kroppens signaler från en enda natts sömn och bedöma en persons risk för mer än 100 olika sjukdomar. Systemet, som kallas SleepFM, har tränats med hjälp av nästan 600.000 timmars sömnregistreringar från 65.000 personer. Dessa inspelningar kommer från polysomnografi, ett djupgående sömntest som använder flera sensorer för att spåra hjärnaktivitet, hjärtfunktion, andningsmönster, ögonrörelser, benrörelser och andra fysiska signaler under sömnen.
Sömnstudier innehåller outnyttjade hälsodata
Polysomnografi anses vara guldstandarden för att bedöma sömn och utförs vanligtvis över natten i ett laboratorium. Den används ofta för att diagnostisera sömnstörningar, men forskare har insett att den också fångar upp en mängd fysiologisk information som inte har analyserats fullt ut. ”Vi registrerar ett förvånansvärt stort antal signaler när vi studerar sömn”, säger Emmanual Mignot, PhD, Craig Reynolds Professor of Sleep Medicine och medförfattare till den nya studien som publiceras i Nature Medicine. ”Det är en slags allmän fysiologi som vi studerar under åtta timmar hos en person som är helt i vår vård. Uppgifterna är mycket omfattande.”

Att lära AI sömnmönster
För att få insikter från data utvecklade forskarna en basmodell, en typ av AI som är utformad för att lära sig allmänna mönster från mycket stora datamängder och sedan tillämpa den kunskapen på många uppgifter. Stora språkmodeller som ChatGPT använder ett liknande tillvägagångssätt, men de tränas på text snarare än biologiska signaler. SleepFM tränades på 585.000 timmar polysomnografidata som samlats in från patienter som undersöktes på sömnkliniker. Varje sömnövervakningssession delades in i femsekunderssegment, som fungerar på samma sätt som ord som används för att träna språkbaserade AI-system. SleepFM lär sig i princip sömnens språk, säger Zou.
Modellen integrerar flera olika informationsflöden, inklusive hjärnsignaler, hjärtrytmer, muskelaktivitet, pulsmätningar och luftflöde under andningen, och lär sig hur dessa signaler interagerar med varandra. För att hjälpa systemet att förstå dessa samband har forskarna utvecklat en träningsmetod som kallas ”Leave-One-Out Contrastive Learning”. I denna metod tas en typ av signal bort i taget och modellen ombeds sedan att rekonstruera den med hjälp av de återstående uppgifterna. En av de tekniska innovationer som forskarna har åstadkommit i detta arbete är att de har kommit på hur de ska harmonisera alla dessa olika datamodaliteter så att de kan mötas och lära sig samma språk.
Förutsägelse av framtida sjukdomar baserat på sömn
Efter träningen anpassade forskarna modellen för specifika uppgifter. Först testade de den i vanliga sömnstudier, till exempel för att identifiera sömnstadier och bedöma svårighetsgraden av sömnapné. I dessa tester matchade eller till och med överträffade SleepFM prestandan hos de nuvarande ledande modellerna. Teamet satte sedan upp ett mer ambitiöst mål: att ta reda på om sömndata kan förutsäga framtida sjukdomar. För att göra detta länkade de polysomnografiska inspelningar med de långsiktiga hälsoresultaten för samma individer. Detta var möjligt eftersom forskarna hade tillgång till decennier av medicinska journaler från en enda sömnklinik.
Stanford Sleep Medicine Center grundades 1970 av den framlidne Dr William Dement, PhD, som allmänt anses vara sömnmedicinens fader. Den största gruppen som användes för att träna SleepFM omfattade cirka 35.000 patienter i åldrarna 2 till 96 år. Deras sömnstudier registrerades på kliniken mellan 1999 och 2024 och matchades med elektroniska patientjournaler som följde vissa patienter i upp till 25 år. Klinikens polysomnografiska register går ännu längre tillbaka, men endast i pappersform, enligt Mignot, som ledde sömncentret från 2010 till 2019. Med hjälp av det kombinerade datasetet granskade SleepFM mer än 1 000 sjukdomskategorier och identifierade 130 tillstånd som kunde förutsägas med rimlig noggrannhet enbart baserat på sömndata. De bästa resultaten uppnåddes för cancer, graviditetskomplikationer, cirkulationssjukdomar och psykiska störningar, med prediktionsvärden över ett C-index på 0,8.
Hur träffsäkerheten för förutsägelser mäts
C-index, eller konkordansindex, mäter hur väl en modell kan rangordna individer efter deras risk. Det indikerar hur ofta modellen korrekt förutser vilken av två individer som först kommer att uppleva en hälsohändelse. ”För alla möjliga par av individer rangordnar modellen vem som är mest benägen att uppleva en händelse – t.ex. en hjärtinfarkt – tidigare. Ett C-index på 0,8 innebär att modellens förutsägelse matchar den faktiska händelsen i 80% av fallen”, förklarar Zou. SleepFM presterade särskilt bra när det gällde att förutsäga Parkinsons sjukdom (C-index 0,89), demens (0,85), hypertonisk hjärtsjukdom (0,84), hjärtinfarkt (0,81), prostatacancer (0,89), bröstcancer (0,87) och dödsfall (0,84).
Forskarna blev positivt överraskade över att modellen kan göra meningsfulla förutsägelser för ett stort antal olika sjukdomar. Zou påpekade också att modeller med lägre noggrannhet, ofta med ett C-index på cirka 0,7, redan används i medicinsk praxis, till exempel som ett verktyg för att förutsäga hur patienter kan reagera på vissa cancerbehandlingar.
Förstå vad AI ser
Forskarna arbetar nu med att förbättra SleepFM:s förutsägelser och bättre förstå hur systemet kommer fram till sina slutsatser. Framtida versioner skulle kunna innehålla data från bärbara enheter för att utöka utbudet av fysiologiska signaler. ”Det förklarar det inte för oss med ord”, säger Zou. ”Men vi har utvecklat olika tolkningstekniker för att ta reda på vad modellen tittar på när den gör en viss sjukdomsförutsägelse.”
Teamet fann att även om hjärtrelaterade signaler hade större betydelse för att förutsäga hjärt-kärlsjukdomar och hjärnrelaterade signaler spelade en större roll för att förutsäga mental hälsa, så kom de mest exakta resultaten från en kombination av alla typer av data. ”Det mesta av den information vi fick för att förutsäga sjukdomar kom från att jämföra de olika kanalerna”, säger Mignot. Fysiska komponenter som inte var synkroniserade – till exempel en hjärna som sover men ett hjärta som är vaket – verkade förebåda problem. Rahul Thapa, doktorand i biomedicinsk datavetenskap, och Magnus Ruud Kjaer, doktorand vid Danmarks tekniska universitet, är medförfattare till studien. Forskare från Danmarks Tekniske Universitet, Köpenhamns universitetssjukhus Rigshospitalet, BioSerenity, Köpenhamns universitet och Harvard Medical School har bidragit till arbetet.






