科学研究

学术讲座

当前位置: 首页 >> 科学研究 >> 学术讲座 >> 正文

数学与统计学院2021年系列学术活动第八场

发布日期:2021-06-11    作者:     点击:

20216月10日下午7点,我院特邀请中国人民大学许王莉教授做线上学术报告,报告由学院院长王纯杰老师主持,学院部分老师、全体研究生参加了本次线上学术报告会。

报告题目:A fast and accurate estimator for large scale linear model viadata averaging

报告摘要:This work is concerned with the estimation problem of linear model when the sample size is extremely large and the data dimension can vary with the sample size. In this setting,the least square estimator based on full data is not feasible with limited computational resources. Many existing methods for this problem are based on sketching technique. We derive fine-grained lower bounds of the conditional mean squared error for sketching methods. For sampling methods, our lower bound provides an attainable optimal convergence rate. We propose a new sketching method based on data averaging. The proposed method reduces the original data to a few averaged observations. These averaged observations still satisfy the linear model and are used to estimate the regression coefficients. The asymptotic behavior of the proposed estimation procedure is studied. Our theoretical results show that the proposed method can achieve a faster convergence rate than the optimal convergence rate for sampling methods. Theoretical and numerical results show that the proposed estimator has good statistical performance as well as low computational cost.

许王莉简介:中国人民大学统计学教授,博士生导师,中国人民大学教学督导专家。近年来一直从事模型拟合优度检验,高维数据分析,随机缺失数据,两阶段抽样数据以及纵向数据分析等方面的统计推断研究。先后主持了4项国家自然科学基金,以及教育部人文社会科学重点研究基地重大项目,北京市自然科学基金重点项目和教育部人文社科基金等多项科研课题, 在统计学国际一流期刊(包括顶级期刊)发表论文70余篇,并在科学出版社合作出版《非参数蒙特卡洛检验及其应用》和单著《缺失数据的模型检验及其应用》。

报告会中,中国人民大学统计系教授首先讲解了样本量极大且数据维数随样本量变化时线性模型的估计问题。许教授表示在这种情况下,基于完整数据的最小二乘估计在有限的计算资源下是不可行的。现有的许多方法都是基于概念性的。接着许教授展示了其推导的用于概念方法的条件均方误差的下界。然后,许教授向我们介绍了一种基于数据平均的采样方法,提供了一个可达到的最佳收敛速度。该方法将原始数据简化为几个平均观测值。这些平均观测值仍然满足线性模型,并用于估计回归系数。最后研究了所提出的估计方法的渐近性。使大家对于数据平均的采样方法的高效性有了更加深入的了解和兴趣。

与会人员踊跃提问,对于许教授讲解的基于数据平均的大规模线性模型快速精确估计进行了热烈的讨论和交流,许教授就提出的问题进行了详细的解答。本次学术交流会使大家深入了解了基于数据平均的大规模线性模型快速精确估计原理和应用,拓展了同学们的视野,聆听报告的师生均表示受益匪浅。

 

 

数学与统计学院

2021年6月10日

 

上一条:数学与统计学院2021年系列学术活动第九场

下一条:数学与统计学院2021年系列学术活动第七场