科研动态
北京大学统计科学中心博士生邵凌轩发表黎曼结构函数型数据分析的研究成果

北京大学统计科学中心与数学科学学院博士生邵凌轩在姚方教授指导下,近期于《The Annals of Statistics》(AOS)接收发表的研究成果实现了对具有黎曼流形结构的稀疏函数型数据的内蕴分析,文中估计方法克服了稀疏观测数据带来的困难以及所在空间弯曲的问题,新的内蕴方法结果不依赖于黎曼流形上坐标标架的选取。该研究对稀疏观测的非欧数据分析问题做出了新的探索,对处理具有特定几何结构的时变数据具有实际应用价值。


  函数型数据分析作为一种对连续观测数据进行建模的有效工具,成为统计学研究的热点领域,对欧式空间取值的函数性数据的研究较为全面。但在实际应用中,当这类数据落入非平直或非欧式空间时,且数据只能在离散的时间或空间点上观测到并受噪声干扰,这给理论和方法的发展带来了巨大的挑战,例如图1所示球面上的飞行轨迹数据(完全观测)或脑影像学中取值为对称正定矩阵的Diffusion Tensor Imaging(稀疏观测的DTI)等。近年来对完全观测下黎曼流形上函数型数据分析已经有所突破,成果发表于Lin and Yao (2019, AOS),但稀疏观测数据的情形下如何进行有效估计和推断尚属空白。

64f60d5e155846f9bf34a870fd3fb1d3.png

图1-1 从伦敦到香港的飞行轨迹数据图

d3e61e670e254234b3e71a6884322ba2.png

图1-2 取值为3ⅹ3矩阵的稀疏观测DTI数据


  针对这一挑战,文章采用了聚集策略(pooling strategy)处理来自不同个体的稀疏观测数据,达到借用个体之间数据信息的目的。为了克服观测数据落在不同向量空间的困难,首先构造了黎曼流形上的协方差向量丛并给出了协方差函数新的定义,进而利用该向量丛上的平行移动(如图2)与度规将不同个体上的稀疏观测数据聚集到同一向量空间,从而可以采用局部线性回归的方法对聚集数据进行有效估计。为了克服数据所在空间弯曲的问题,论文利用了几何与拓扑中的和乐群(holonomy)理论来控制平行移动带来的偏差,给出了黎曼流形上协方差函数估计的最优收敛速率,并揭示了在不同采样密度下其收敛速率的相变现象。

f78b0e93d67e494db58465177059d69a.png

图2 左图为平直空间中的平行移动;右图为弯曲空间中的平行移动


  论文主要创新点在于提出的方法不依赖于黎曼流形上坐标框架的选取,既适用于欧几里得空间中的子流形,也适用于没有外部嵌入的流形,首次实现了对黎曼流形上取值的稀疏函数性数据的内蕴估计。最后在实证研究中,对健康人群和患有阿尔兹海默症人群的DTI数据进行了分析,基于所估计协方差函数的主因子分析体现了阿尔兹海默症人群的大脑海马体区域DTI各向异性比例较低的病理特征(图3)。

d3d1610ebfb648b5940b98badd2b3b6a.png

图3  第一二、三四行分别表示病患组和正常组的第一个、第二个特征向量;每个液滴长宽高分别代表DTI矩阵的三个特征根,特征根的值越接近,其各向异性程度越低


  整体而言,该论文与Lin and Yao (2019)一起作为上下篇,给出了黎曼流形空间中取值的函数型数据在不同采样情形下内蕴估计的统一方法和理论框架,为进一步研究此类数据的回归、分类或聚类等问题奠定了基础。


  《The Annals of Statistics》为国际统计学界影响最为广泛的顶尖学术期刊之一,邵凌轩与新加坡国立大学助理教授林振华为该论文共同第一作者。邵凌轩为2018级直博生,将于2022年9月入职复旦大学管理学院统计与数据科学系青年副研究员暨助理教授,林振华是姚方教授在多伦多大学指导的博士生(2017年毕业)。通讯作者姚方为北京大学讲席教授,任北京大学统计科学中心主任、数学科学学院概率统计系主任,入选国家高层次人才计划。


  文献引用:

  Lin, Z., and Yao, F. (2019). Intrinsic Riemannian functional data analysis. The Annals of Statistics , 47, 3533-3577.


  参考资料:

  Shao, L., Lin Z., and Yao, F. (2022)  Intrinsic Riemannian functional data analysis for sparse longitudinal observations.  The Annals of Statistics, https://imstat.org/journals-and-publications/annals-of-statistics/annals-of-statistics-future-papers/.