En urolig nat fører ofte til træthed næste dag, men det kan også være tegn på helbredsproblemer, som måske først opstår langt senere. Forskere ved Stanford Medicine og deres samarbejdspartnere har udviklet et system med kunstig intelligens, der kan undersøge kroppens signaler fra en enkelt nats søvn og vurdere en persons risiko for mere end 100 forskellige sygdomme. Systemet, som kaldes SleepFM, blev trænet ved hjælp af næsten 600.000 timers søvnoptagelser fra 65.000 mennesker. Optagelserne stammer fra polysomnografi, en dybtgående søvntest, der bruger flere sensorer til at spore hjerneaktivitet, hjertefunktion, vejrtrækningsmønstre, øjenbevægelser, benbevægelser og andre fysiske signaler under søvnen.
Søvnundersøgelser indeholder uudnyttede sundhedsdata
Polysomnografi betragtes som guldstandarden for vurdering af søvn og udføres typisk natten over i et laboratorium. Selvom det ofte bruges til at diagnosticere søvnforstyrrelser, har forskere erkendt, at det også indfanger et væld af fysiologiske oplysninger, som ikke er blevet analyseret fuldt ud. “Vi registrerer et forbløffende antal signaler, når vi studerer søvn,” siger Dr. Emmanual Mignot, PhD, Craig Reynolds Professor of Sleep Medicine og medforfatter på den nye undersøgelse, der er offentliggjort i Nature Medicine. “Det er en slags generel fysiologi, som vi studerer i otte timer hos en person, der er helt i vores varetægt. Dataene er meget omfattende.”

Undervisning i AI-søvnmønstre
For at få indsigt i dataene udviklede forskerne en basismodel, en type AI, der er designet til at lære generelle mønstre fra meget store datasæt og derefter anvende denne viden på mange opgaver. Store sprogmodeller som ChatGPT bruger en lignende tilgang, men de er trænet på tekst i stedet for biologiske signaler. SleepFM blev trænet på 585.000 timers polysomnografidata indsamlet fra patienter, der blev undersøgt på søvnklinikker. Hver søvnovervågningssession blev opdelt i fem sekunders segmenter, som fungerer på samme måde som ord, der bruges til at træne sprogbaserede AI-systemer. SleepFM lærer i bund og grund søvnens sprog, siger Zou.
Modellen integrerer flere informationsstrømme, herunder hjernesignaler, hjerterytme, muskelaktivitet, pulsmålinger og luftstrøm under vejrtrækning, og lærer, hvordan disse signaler interagerer med hinanden. For at hjælpe systemet med at forstå disse forhold udviklede forskerne en træningsmetode kaldet “Leave-One-Out Contrastive Learning”. I denne tilgang fjernes en type signal ad gangen, og modellen bliver bedt om at rekonstruere det ved hjælp af de resterende data. En af de tekniske nyskabelser, de opnåede i dette arbejde, er at finde ud af, hvordan man harmoniserer alle disse forskellige datamodaliteter, så de kan mødes og lære det samme sprog.
Forudsigelse af fremtidige sygdomme baseret på søvn
Efter træningen tilpassede forskerne modellen til specifikke opgaver. Først testede de den i standard søvnundersøgelser, som f.eks. at identificere søvnstadier og vurdere sværhedsgraden af søvnapnø. I disse tests matchede eller overgik SleepFM endda de nuværende førende modellers præstationer. Teamet forfulgte derefter et mere ambitiøst mål: at finde ud af, om søvndata kan forudsige fremtidige sygdomme. For at gøre dette koblede de polysomnografi-optagelser med de samme personers langsigtede sundhedsresultater. Det var muligt, fordi forskerne havde adgang til årtiers lægejournaler fra en enkelt søvnklinik.
Stanford Sleep Medicine Center blev grundlagt i 1970 af afdøde Dr. William Dement, PhD, der i vid udstrækning betragtes som søvnmedicinens fader. Den største gruppe, der blev brugt til at træne SleepFM, omfattede ca. 35.000 patienter i alderen 2 til 96 år. Deres søvnundersøgelser blev registreret på klinikken mellem 1999 og 2024 og matchet med elektroniske sundhedsjournaler, der fulgte nogle patienter i op til 25 år. Klinikkens polysomnografi-journaler går endnu længere tilbage, men kun i papirform, ifølge Mignot, som ledede søvncentret fra 2010 til 2019. Ved hjælp af dette kombinerede datasæt gennemgik SleepFM mere end 1.000 sygdomskategorier og identificerede 130 tilstande, der kunne forudsiges med rimelig nøjagtighed baseret på søvndata alene. De bedste resultater blev opnået for kræft, graviditetskomplikationer, kredsløbssygdomme og psykiske lidelser med forudsigelsesværdier over et C-indeks på 0,8.
Sådan måles forudsigelsesnøjagtigheden
C-indekset, eller konkordansindekset, måler, hvor godt en model kan rangordne personer i forhold til deres risiko. Det angiver, hvor ofte modellen korrekt forudsiger, hvem af to personer der først vil opleve en sundhedshændelse. “For alle mulige par af personer rangordner modellen, hvem der er mest tilbøjelig til at opleve en begivenhed – f.eks. et hjerteanfald– tidligere. Et C-indeks på 0,8 betyder, at modellens forudsigelse matcher den faktiske begivenhed i 80 % af tilfældene,” forklarer Zou. SleepFM klarede sig særligt godt til at forudsige Parkinsons sygdom (C-indeks 0,89), demens (0,85), hypertensiv hjertesygdom (0,84), hjerteanfald (0,81), prostatakræft (0,89), brystkræft (0,87) og død (0,84).
Forskerne var glædeligt overraskede over, at modellen kan give meningsfulde forudsigelser for en lang række forskellige sygdomme. Zou påpegede også, at modeller med lavere nøjagtighed, ofte med et C-indeks på omkring 0,7, allerede bruges i medicinsk praksis, f.eks. som et værktøj til at forudsige, hvordan patienter vil reagere på visse kræftbehandlinger.
Forståelse af, hvad AI ser
Forskerne arbejder nu på at forbedre SleepFM’s forudsigelser og bedre forstå, hvordan systemet når frem til sine konklusioner. Fremtidige versioner kan inkorporere data fra bærbare enheder for at udvide udvalget af fysiologiske signaler. “Det forklarer det ikke for os med ord,” siger Zou. “Men vi har udviklet forskellige fortolkningsteknikker for at finde ud af, hvad modellen ser på, når den forudsiger en bestemt sygdom.”
Teamet fandt ud af, at mens hjerterelaterede signaler havde større indflydelse på forudsigelsen af hjerte-kar-sygdomme, og hjernerelaterede signaler spillede en større rolle i forudsigelsen af mental sundhed, kom de mest nøjagtige resultater fra kombinationen af alle typer data. “De fleste af de oplysninger, vi fik til at forudsige sygdomme, kom fra at sammenligne de forskellige kanaler,” siger Mignot. Fysiske komponenter, der ikke var synkroniserede – som f.eks. en hjerne, der sover, men et hjerte, der er vågent – syntes at varsle problemer. Rahul Thapa, ph.d.-studerende i biomedicinsk datavidenskab, og Magnus Ruud Kjær, ph.d.-studerende ved Danmarks Tekniske Universitet, er medforfattere til undersøgelsen. Forskere fra Danmarks Tekniske Universitet, Københavns Universitetshospital Rigshospitalet, BioSerenity, Københavns Universitet og Harvard Medical School har bidraget til arbejdet.





