报告题目:Statistical Learning Methods on Wearable Devices and Precision Medicine可穿戴设备的统计学习方法和精准医疗
报告时间:2021年5月21日下午3点
报告形式:腾讯会议
会议链接:https://meeting.tencent.com/s/XKIHHuDbK6oP
会议 ID:671 542 863
主办单位:科研处/数学与统计学院
主讲人:史建清
史建清简介:南方科技大学统计与数据科学系教授,曾任英国纽卡斯尔大学(Newcastle University)统计学教授,英国国家艾伦图灵研究院图灵研究员。主要研究方向包括函数型数据分析,生物医学统计,缺失数据分析等。在国际学术刊物上发表高水平学术论文多篇,包括统计顶级期刊 JRSSB, JASA, Biometrika和Biostatistics。曾任英国皇家统计协会《应用统计》副主编,Guest AE for JRSS discussion paper,英国纽卡斯尔大学云计算和大数据研究培训中心副主任。曾获邀任剑桥大学世界最顶级数学学院之一的牛顿学院访问研究员,获美国统计协会非参数统计分会年度最佳论文奖,2012年获英国 Wellcome trust Health Innovation Challenge Fund,共计210万英镑。2011年在著名统计学出版社Chapman & Hall 出版专著:Gaussian Process Regression Analysis for Functional Data。
报告摘要:可穿戴设备已经被越来越多地用于日常生活和健康医疗中,但对其海量数据的统计学习方法还处在初期阶段。可穿戴设备收集日常生活中的数据(即free-living数据)。相对于实验数据,free-living数据有以下特点(以AX6数据为例子):(1)Free-living数据的随意性:受试者收集的数据是多段长短不同的,非标准的多维时间序列和函数型数据,我们要对此类非标准数据建立标准,和建立个体化的精准预测模型;(2)巨大的差异性(非齐性):除了个体间的差异外,还有环境文化差异,以及同一个体日常生活的非规律性等;(3)数据结构异常复杂:例如原始数据可以是对应各类动作步态的过程变量(加速度或角速度),通常还包含较大的噪音信号,使得数据在不同时间和频率上都有非常不同的均值和方差结构;(4)海量数据:受试者佩戴可穿戴设备七天产生的原始数据总量超过5G,如何去除海量数据中的无用信息,保留建模所需的有效信息是待解决的问题。本讲座将会利用一些实际例子讨论如何解决这些问题的思路。