Uma noite agitada geralmente leva à fadiga no dia seguinte, mas também pode indicar problemas de saúde que podem não surgir até muito mais tarde. Cientistas da Stanford Medicine e seus colaboradores desenvolveram um sistema de inteligência artificial que pode examinar os sinais corporais de uma única noite de sono e avaliar o risco de uma pessoa ter mais de 100 doenças diferentes. O sistema, chamado SleepFM, foi treinado usando quase 600.000 horas de registros de sono de 65.000 pessoas. Essas gravações são provenientes de polissonografia, um exame aprofundado do sono que utiliza vários sensores para rastrear a atividade cerebral, a função cardíaca, os padrões de respiração, os movimentos dos olhos, os movimentos das pernas e outros sinais físicos durante o sono.
Os estudos do sono contêm dados de saúde inexplorados
A polissonografia é considerada o padrão ouro para avaliar o sono e geralmente é realizada durante a noite em um laboratório. Embora seja frequentemente usada para diagnosticar distúrbios do sono, os pesquisadores reconheceram que ela também captura uma grande quantidade de informações fisiológicas que ainda não foram totalmente analisadas. “Registramos um número surpreendente de sinais quando estudamos o sono”, disse o Dr. Emmanual Mignot, PhD, Craig Reynolds Professor of Sleep Medicine e coautor sênior do novo estudo publicado na Nature Medicine. “É um tipo de fisiologia geral que estudamos durante oito horas em uma pessoa que está totalmente sob nossos cuidados. Os dados são muito abrangentes.”

Ensinando padrões de sono à IA
Para obter insights dos dados, os pesquisadores desenvolveram um modelo básico, um tipo de IA projetado para aprender padrões gerais de conjuntos de dados muito grandes e, em seguida, aplicar esse conhecimento a muitas tarefas. Modelos de linguagem grandes, como o ChatGPT, usam uma abordagem semelhante, mas são treinados em texto e não em sinais biológicos. O SleepFM foi treinado em 585.000 horas de dados de polissonografia coletados de pacientes que foram examinados em clínicas do sono. Cada sessão de monitoramento do sono foi dividida em segmentos de cinco segundos, que funcionam de forma semelhante às palavras usadas para treinar sistemas de IA baseados em linguagem. O SleepFM aprende essencialmente a linguagem do sono, disse Zou.
O modelo integra vários fluxos de informações, inclusive sinais cerebrais, ritmos cardíacos, atividade muscular, medições de pulso e fluxo de ar durante a respiração, e aprende como esses sinais interagem entre si. Para ajudar o sistema a entender essas relações, os pesquisadores desenvolveram um método de treinamento chamado “Leave-One-Out Contrastive Learning”. Nessa abordagem, um tipo de sinal é removido de cada vez e o modelo é solicitado a reconstruí-lo usando os dados restantes. Uma das inovações técnicas que eles conseguiram nesse trabalho foi descobrir como harmonizar todas essas diferentes modalidades de dados para que elas possam se unir e aprender a mesma linguagem.
Previsão de doenças futuras com base no sono
Após o treinamento, os pesquisadores adaptaram o modelo para tarefas específicas. Primeiro, eles o testaram em estudos padrão do sono, como a identificação dos estágios do sono e a avaliação da gravidade da apneia do sono. Nesses testes, o SleepFM igualou ou até mesmo superou o desempenho dos principais modelos atuais. Em seguida, a equipe buscou uma meta mais ambiciosa: descobrir se os dados do sono podem prever doenças futuras. Para isso, eles associaram os registros de polissonografia com os resultados de saúde de longo prazo dos mesmos indivíduos. Isso foi possível porque os pesquisadores tiveram acesso a décadas de registros médicos de uma única clínica do sono.
O Stanford Sleep Medicine Center foi fundado em 1970 pelo falecido Dr. William Dement, PhD, amplamente considerado o pai da medicina do sono. O maior grupo usado para treinar o SleepFM incluía cerca de 35.000 pacientes com idades entre 2 e 96 anos. Seus estudos do sono foram registrados na clínica entre 1999 e 2024 e combinados com registros eletrônicos de saúde que acompanharam alguns pacientes por até 25 anos. Os registros de polissonografia da clínica são ainda mais antigos, mas apenas em papel, de acordo com Mignot, que dirigiu o centro do sono de 2010 a 2019. Usando esse conjunto de dados combinados, o SleepFM analisou mais de 1.000 categorias de doenças e identificou 130 condições que poderiam ser previstas com razoável precisão com base apenas nos dados do sono. Os melhores resultados foram obtidos para câncer, complicações na gravidez, doenças circulatórias e transtornos mentais, com valores de previsão acima de um índice C de 0,8.
Como a precisão da previsão é medida
O índice C, ou índice de concordância, mede a capacidade de um modelo de classificar os indivíduos de acordo com seu risco. Ele indica com que frequência o modelo prevê corretamente qual dos dois indivíduos sofrerá um evento de saúde primeiro. “Para todos os pares possíveis de indivíduos, o modelo classifica quem tem maior probabilidade de sofrer um evento – como um ataque cardíaco – mais cedo. Um índice C de 0,8 significa que a previsão do modelo corresponde ao evento real em 80% dos casos”, explicou Zou. O SleepFM teve um desempenho particularmente bom na previsão da doença de Parkinson (índice C de 0,89), demência (0,85), doença cardíaca hipertensiva (0,84), ataque cardíaco (0,81), câncer de próstata (0,89), câncer de mama (0,87) e morte (0,84).
Os pesquisadores ficaram agradavelmente surpresos com o fato de o modelo poder fazer previsões significativas para uma ampla gama de doenças diferentes. Zou também destacou que os modelos com menor precisão, geralmente com um índice C de cerca de 0,7, já estão sendo usados na prática médica, por exemplo, como uma ferramenta para prever como os pacientes podem responder a determinados tratamentos contra o câncer.
Entendendo o que a IA vê
Os pesquisadores agora estão trabalhando para aprimorar as previsões do SleepFM e entender melhor como o sistema chega às suas conclusões. Versões futuras poderão incorporar dados de dispositivos vestíveis para ampliar a gama de sinais fisiológicos. “Ele não nos explica em palavras”, disse Zou. “Mas desenvolvemos várias técnicas de interpretação para descobrir o que o modelo está vendo quando faz uma determinada previsão de doença.”
A equipe descobriu que, embora os sinais relacionados ao coração tenham tido um impacto maior na previsão de doenças cardiovasculares e os sinais relacionados ao cérebro tenham tido um papel maior na previsão da saúde mental, os resultados mais precisos vieram da combinação de todos os tipos de dados. “A maioria das informações que obtivemos para a previsão de doenças veio da comparação dos diferentes canais”, disse Mignot. Os componentes físicos que estavam fora de sincronia – como um cérebro que está dormindo, mas um coração que está acordado – pareciam anunciar problemas. Rahul Thapa, estudante de doutorado em ciência de dados biomédicos, e Magnus Ruud Kjaer, estudante de doutorado da Universidade Técnica da Dinamarca, são os coautores do estudo. Pesquisadores da Universidade Técnica da Dinamarca, do Hospital Universitário de Copenhague Rigshospitalet, da BioSerenity, da Universidade de Copenhague e da Harvard Medical School contribuíram para esse trabalho.






