科研动态
姚方教授在《Annals of Statistics》和《Biometrika》上连续发表最新研究成果

北京大学数学科学学院与统计科学中心姚方教授团队关于高维两样本检验的论文“Distribution and Correlation Free Two-Sample Test of High-dimensional Means”被《Annals of Statistics》正式接收;关于函数型数据在流形上回归分析的论文“Functional Regression on Manifold with Contamination”被《Biometrika》正式接收。《Annals of Statistics》与《Biometrika》均为国际统计学界影响最为广泛的顶尖学术期刊。两篇文章的通讯作者姚方教授现任北京大学讲席教授,国家特聘专家,北大统计科学中心主任;第一作者薛楷杰、林振华为姚方指导的博士生,现分别在南开大学统计与数据科学学院、新加坡国立大学统计与应用概率系担任助理教授。


“Distribution and Correlation Free Two-Sample Test of High-dimensional Means”提出了一种计算简单易行的高维两样本均值检验方法,除了对随机向量中一维元素的矩和尾的性质做了一些比传统方法更宽泛的假设外,对样本中个体的分布、协相关结构没有做过多约束。该方法不仅容许样本中个体拥有任意分布类型(例如无需遵从独立同分布或者亚高斯分布等),而且允许每个样本个体拥有任意协相关结构(例如协相关矩阵无需可逆或者特征值无需有界等)。除此之外,该检验方法还允许两样本量相差悬殊,在宽泛的备择假设条件下势函数依然满足相合性,允许数据维度随样本量指数级增长等。因此,该方法相比传统方法具有更广泛的适用范围,能够适应现实情况中更为复杂的情形。在计算方面,该检验方法使用高效便捷的Multiplier Bootstrap估计临界值,在与现有其他方法的比较中具有明显优势。


近年来,流形上的数据分析成为统计学研究的新兴热点之一,姚方教授团队在“Functional Regression on Manifold with Contamination”中提出了对带有误差项的函数型自变量的非参回归模型进行流形估计的思想,从而达到传统方法(例如主因子分析或基函数展开等)无法实现的非线性降维的目的。论文综合了流形维数估计方法、切空间估计方法、局部线性回归理论,提出了针对回归函数的估计量,并给出了估计量的多项式收敛速度,从方法上解决了函数型自变量非参回归模型对数收敛速率的难题。该模型与方法的实际应用广泛,例如用于分光光度法研究肉块的脂肪含量问题、在胼胝体多发性硬化患者中的认知功能与大脑微结构的关系等。


• Kaijie Xue and Fang Yao. (2020). Distribution and correlation free two-sample test of high-dimensional means. Annals of Statistics, to appear.


• Zhenhua Lin and Fang Yao. (2020). Functional regression on manifold with contamination. Biometrika, to appear.