科学研究

学术讲座

当前位置: 首页 >> 科学研究 >> 学术讲座 >> 正文

数学与统计学院2024年系列学术活动第三十五场

发布日期:2024-10-13    作者:     点击:

通讯员:关迪20241012日(星期上午10:30,我院特邀北京大学数学科学学院统计学教艾明要在南湖校区教学科研楼404教室做学术报告,报告由学院副院长杨凯副教授主持本院部分研究生和部分老师参加了本次学术报告会。

报告题目:Optimal Subsampling for Big Data: from 'Static Data' to 'Data Streams'

报告摘要:Subsampling methods are effective techniques to reduce computational burden and maintain statistical inference efficiency for big data. In this talk, we will review different subsampling techniques for efficiently dealing with different types of big data, not only for different inferential models from linear model, to generalized linear model, and to estimation equations, but also for different types of data from static data to data streams. To deal with the situation that the full data are stored in different blocks or at multiple locations, a distributed subsampling framework is developed, in which statistics are computed simultaneously on smaller partitions of the full data. Finally, the proposed strategies are illustrated and evaluated through numerical experiments on both simulated and real data sets.

艾明要简介:艾明要,北京大学数学科学学院统计学二级教授、博士生导师。兼任全国应用统计专业学位研究生教育指导委员会委员、培养组组长,中国现场统计研究会副理事长,中国数学会概率统计学会第十一届理事会秘书长,中国统计学会常务理事。担任四个国际重要SCI期刊Stat SinicaJSPISPLStat编委,国内核心期刊 《系统科学与数学》、《数理统计与管理》、《数学进展》编委,科学出版社《统计与数据科学丛书》编委。主要从事大数据样理论与算法、试验设计与分析、计算机仿真试验与建模、应用统计的教学和研究工作,在AOSJASABiometrika、《中国科学》等国内外重要期刊发表学术论文八十余篇。主持国家自然科学基金重点项目1项、重点项目子课题1项、面上项目5项,参与完成科技部重点研发计划项目2项。北京大学通识教育核心课程主讲教师,两次获得北京大学优秀博士学位论文指导教师,获北京市高等学校优秀教学成果二等奖。

报告会中,艾教授主要介绍了大数据的最佳子抽样:从 “静态数据 ”到 “数据流”的相关问题。艾教授通过四篇文献讲解了有效处理不同类型大数据的不同子抽样技术,这些技术不仅适用于从线性模型、广义线性模型到估计方程的不同推理模型,还适用于从静态数据到数据流的不同数据类型。子抽样方法的优点是减轻计算负担、保持大数据统计推断效率的有效技术。为了应对完整数据存储在不同区块或多个位置的情况,开发了分布式子抽样框架,在该框架中,统计信息将同时在完整数据的较小分区上进行计算。

艾教授通过细致又准确的讲解,使得同学们对数据流的子抽样算法有了更深的了解。对于现在正在研究抽样算法的同学具有很大的帮助。报告会后,老师和同学表达了对该方向浓厚的兴趣,与艾教授充分的讨论了对于不同模型关于子抽样算法的的相关疑问,艾教授也对相关的疑问做了充分解答。通过此次报告会,扩充了同学们对子抽样算法的认识与了解,让同学们大受启发。





(审核人:王丹、王纯杰)

数学与统计学院

20241012


上一条:数学与统计学院2024年系列学术活动第三十六场

下一条:数学与统计学院2024年系列学术活动第三十四场