ITBear旗下自媒体矩阵:

麻省理工等借Apple Watch数据构建AI模型 挖掘健康数据潜力助力疾病预测

   时间:2025-12-11 16:09:36 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

麻省理工学院与Empirical Health的研究团队近日取得一项突破性进展,他们基于300万“人-天”的Apple Watch健康数据,开发出一种新型自监督学习模型,在疾病预测领域展现出显著优势。这项研究通过创新的数据处理方式,成功解决了可穿戴设备数据不完整、不规则的难题,为健康监测技术开辟了新方向。

研究核心基于meta前首席AI科学家Yann LeCun提出的“联合嵌入预测架构”(JEPA)。该架构突破传统AI系统直接重建缺失数据的模式,转而训练模型从上下文推断缺失部分的语义表征。例如在图像处理中,系统不会尝试还原被遮蔽区域的原始像素,而是通过可见部分推断其抽象特征。这种思路被研究团队创新性地应用于健康数据领域,特别是处理心率、睡眠时长等存在大量缺失的时间序列指标。

研究团队构建的纵向数据集涵盖16,522名参与者,累计记录约300万“人-天”的生理数据。每位参与者每日记录63项指标,覆盖心血管、呼吸、睡眠、运动等五大健康维度。值得注意的是,仅15%的参与者拥有完整医疗标注记录,传统监督学习框架下85%的数据难以利用。研究团队通过自监督预训练策略,先让模型在无标注数据中学习通用特征,再针对特定疾病在少量标注数据上进行微调。

在数据处理环节,研究人员将每条观测记录转化为包含日期、数值、指标类型的“三元组”,进而编码为可学习的“token”。通过随机掩码部分token,模型需要预测被遮挡片段的嵌入表示。这种训练方式使模型能够捕捉数据中的潜在模式,即使面对极端不平衡的记录频率——某些指标仅0.4%的记录时间出现,而另一些指标存在于99%的日常读数中。

实验结果显示,新型模型在多项疾病预测任务中表现优异:高血压预测的AUROC指标达到86.8%,慢性疲劳综合征为81%,病态窦房结综合征同样取得86.8%的成绩。虽然房扑预测的70.5%略低于部分基线模型,但整体性能优势明显。研究特别指出,AUROC和AUPRC指标反映的是模型对病例的排序能力,而非传统意义上的预测准确率。

这项成果的重要价值在于证明了日常可穿戴设备的潜在价值。尽管Apple Watch等设备存在佩戴时间不固定、数据记录不连续等问题,但通过创新的模型架构和训练策略,仍能从海量数据中提取有效健康信号。研究团队开发的JETS模型不仅为疾病早期预警提供了新工具,更展示了如何最大化利用不完整健康数据的可能性,为智能健康监测领域树立了新的技术标杆。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version