失眠之夜常导致次日疲惫不堪,但它也可能预示着某些健康隐患——这些隐患或许要到很久以后才会显现。斯坦福大学医学院的科学家及其合作者开发了一套人工智能系统,能够通过分析单夜睡眠期间的身体信号,评估个体罹患100多种不同疾病的风险。 该系统名为SleepFM,通过65,000名受试者近60万小时的睡眠记录进行训练。这些记录源自多导睡眠图检测——这种深度睡眠测试通过多传感器追踪睡眠期间的大脑活动、心脏功能、呼吸模式、眼球运动、腿部活动及其他生理信号。
睡眠研究蕴藏未开发健康数据
多导睡眠图被视为评估睡眠的黄金标准,通常在实验室进行整夜监测。虽然该技术常用于诊断睡眠障碍,但研究人员已意识到它还捕捉了大量尚未充分分析的生理信息。 “睡眠研究中记录的信号数量惊人,”睡眠医学克雷格·雷诺兹讲席教授、新研究的共同资深作者埃曼纽尔·米尼奥特博士指出,”这相当于在完全受控环境下,对受试者进行长达八小时的全面生理学研究,数据极其丰富。”

训练人工智能识别睡眠模式
为从数据中获取洞见,研究人员开发了基础模型——这类人工智能通过学习海量数据集中的普遍模式,进而将知识应用于多种任务。 类似ChatGPT的大型语言模型采用相似的训练方法,但它们基于文本而非生物信号进行训练。SleepFM模型则利用58.5万小时的睡眠监测数据进行训练,这些数据来自睡眠诊所的患者检查。每次睡眠监测被分割为五秒时段,其功能类似于训练语言型AI系统的单词。周博士解释道,SleepFM本质上是在学习睡眠的语言。
该模型整合了多维信息流,包括脑电信号、心律、肌肉活动、脉搏测量及呼吸气流数据,并学习这些信号间的交互关系。为帮助系统理解这些关联,研究人员开发了名为”留一法对比学习”的训练方法。 该方法每次移除一种信号类型,要求模型利用剩余数据进行重建。这项研究的技术突破之一,在于成功协调了所有不同数据模态,使其能够协同学习同一种语言。
基于睡眠预测未来疾病
训练完成后,研究人员将模型应用于具体任务。首先在标准睡眠研究中进行测试,包括识别睡眠阶段和评估睡眠呼吸暂停严重程度。在这些测试中,SleepFM的性能与当前领先模型持平甚至更胜一筹。 随后团队提出更宏大的目标:探究睡眠数据能否预测未来疾病。为此,他们将多导睡眠图记录与同批受试者的长期健康结果进行关联。这一研究得以实现,源于研究人员获取了某睡眠诊所数十年的完整医疗档案。
斯坦福睡眠医学中心由被誉为睡眠医学之父的已故威廉·迪蒙特博士于1970年创立。用于训练SleepFM的最大数据集包含约3.5万名2至96岁患者,其睡眠研究记录于1999至2024年间在该诊所完成,并匹配了长达25年的电子健康档案。 据2010至2019年间担任该中心主任的米尼奥特介绍,诊所的睡眠多导图记录可追溯至更早时期,但仅存纸质档案。通过整合这些数据集,SleepFM系统分析了逾千种疾病类别,最终确定130种仅凭睡眠数据即可实现较高预测精度的疾病。在癌症、妊娠并发症、循环系统疾病及精神障碍领域的预测效果最佳,其预测值C指数均超过0.8。


