(通讯员:关迪)2024年10月12日(星期六)上午7:30,我院特邀山东大学林路教授在南湖校区教学科研楼404教室做学术报告,报告由学院副院长杨凯副教授主持,本院部分研究生和部分老师参加了本次学术报告会。
报告题目:Quantile-Matched DC in Massive Data Regression
报告摘要:The issues of bias-correction and robustness are crucial in the strategy of divide-and-conquer (DC) for massive data sets. For the models with asymmetric error distributions, the weighted composite quantile regression (WCQR) can correct the non-negligible bias of composite quantile regression (CQR), but the selecting weights heavily depends on the nonparametric pilot estimations for some error-dependent nonparametric functions, and then the relevant estimation procedure is inconvenient to implement and is not robust to the outliers and fat-tailed distributions. This work explores a new DC-based WCQR method for nonparametric models with general error distributions. By fully utilizing the model structure, a quantile-matched composite is proposed. In the new framework, the non-negligible bias of the WCQR estimators is explicitly expressed by a parametric estimation together with robust statistics, instead of the unknown error-dependent nonparametric functions. Then the non-negligible bias can be easily corrected by selecting the robust weights. By the asymptotic properties, the optimal weights are attained. The theoretical properties of the new methods are systematically investigated and the behaviors are further illustrated by comprehensive simulation studies and real data analyses. Compared with the competitors, the new methods have the favorable features of estimation accuracy, robustness, applicability and communication efficiency.
林路简介:林路,山东大学中泰证券金融研究院教授、博士生导师,第一和第二届教育部应用统计专业硕士教育指导委员会成员,山东省教育厅应用统计专业硕士教育指导委员会成员,山东省政府参事,济南应用数学高等研究院院长。从事大数据、高维统计、非参数和半参数统计以及金融统计等方的研究,在国内外统计学、机器学习和相关应用学科顶级期刊和其它重要期刊(包括Ann. Statist., JMLR, Stat. Comput.和中国科学) 发表研究论文130余篇;多个金融策略资政报告得到省长的正面批示;主持过多项国家自然科学基金课题、全国统计科学研究重大项目、教育部博士点专项基金课题、教育部新文科课题、山东省自然科学基金重点项目等;获得国家统计局颁发的全国统计优秀研究成果一等和二等奖,山东省优秀教学成果一等奖(均排名第一)。
报告会中,林教授主要介绍了在海量数据回归中的量子匹配直流的相关问题。由于在非对称误差分布的模型中,加权复合量化回归(WCQR)可以纠正复合量化回归(CQR)的不可忽略的偏差,但对于一些误差依赖的非参数函数,权重的选择严重依赖于非参数先导估计,因此对异常值和胖尾分布也不具有鲁棒性。故而针对具有一般误差分布的非参数模型,探索了一种新的基于直流的 WCQR 方法。通过充分利用模型结构,提出了一种量化匹配复合方法。其中通过选择稳健权重,就可以轻松纠正不可忽略的偏差。根据对比新方法的估计精度高、鲁棒性更强。
林教授的报告内容研究方向前沿,向大家充分展示了对于海量数据在做量子匹配直流方向的研究。报告会上,大家都表现出对于该研究方向浓厚的兴趣,报告现场十分融洽。会后,林教授同大家展开了热烈的讨论,林教授对于大家提出的与该报告会相关的方法问题做出了专业的解答和建议。此次报告会取得的效果斐然,极大的拓宽了学生们的科研视野,充分了解了报告会中相关方向的发展前景。
(审核人:王丹、王纯杰)
数学与统计学院
2024年10月12日