统计咨询中心
统计与体育

作者:房祥忠

刚刚闭幕的东京奥运会女子自行车公路赛爆出了一个最大的冷门,没有教练、没有队友、没有世界排名的奥地利选手安娜·基森霍弗(Anna Kiesenhofer)战胜包括前世界冠军在内的多名高手夺得金牌。人们十分好奇这位30岁的基森霍弗如何能得冠。赛后人们发现了神奇之处,这位冠军得主拥有数学博士学位,在推特中还发现她通过科学研究的方法指导自己平时的训练。她在推特中曾关心的一个问题是在大于摄氏38.5度下的酷热环境的训练和凉爽环境下训练的时间等效性问题。她所阅读的一篇发表在期刊《Journal of Thermal Biology》上的文章则做了严格的试验设计和统计分析。24名男子被随机分成三组进行热适应性试验。这三组分别叫做固定强度组、连续等温热适应组和递进等温热适应组。通过精心安排的项目训练和对身体指标的测量获得了所需要的对应关系。这些结果显然可以科学指导运动员在自己的场地训练出气候环境很不相同的比赛场地的效果。

实际上统计在体育上的应用很早就有了,这个领域传统上称为体育统计,现在也称为体育分析,在谷歌查询这两个词条,具有几乎相同的条目。体育统计过去大多是用于记录训练和比赛成绩,而现在的主要目的则更多是用于发现优秀选手和指导训练与比赛。最著名的一个例子被好莱坞拍成了奥斯卡最佳影片,MoneyBall,中文名字被翻译成点球成金。电影讲述奥克兰运动家棒球队总经理比利·比恩在耶鲁大学经济学博士彼得·布兰德帮助下,利用数据分析方法以小搏大、力抗比他们薪资额多数倍的大球队的过程。他的这种方法后来被更多球队使用取得了很好的成绩。这部影片的影响之广,以至于体育统计和体育分析现今的这个时代被称为体育的MoneyBall时代。

统计分析之所以有效,是因为体育比赛结果具有极大的不确定性,这也是体育最吸引观众的地方,而规律隐藏在这些不确定的表象里。统计分析已经影响了整个体育行业,在当代体育运动中占有了重要地位。基于数据的统计分析技术重塑了体育行业的价值评价、商业模式和监管过程。在我们最常见的情景里,电视解说员在足球比赛时可以介绍每个球队的控球时间比以及射门成功率,在篮球比赛时会介绍某个球员罚球命中率和整个赛季的得分数等。运动员利用越来越成熟的统计分析服务,可以获得更好的身体和心理训练以迎接挑战。管理部门或者大数据公司记录了来自各类体育比赛的大数据。国际上一些足球、篮球、网球等运动俱乐部已经与统计分析专业背景的专家签约进行赛前赛后分析。在精准的统计分析的帮助下,来自各个项目的管理者、教练员和运动员可以更加了解他们自己各自的使命。

要保持一项运动的吸引力,必须经常有新人的加入。物色精英人才对一个团队管理者来说是一个日常且非常重要的工作。那么如何选拔人才呢?以前人们通过观看运动员的训练和比赛,凭个人直观来选拔人才。现在人们通过统计分析,寻找运动员的“价值”以及寻找那些对“价值”相关的指标,然后建立标准模型进行判断分析。利用统计推断获得的结果可能会和直觉大不相同。

要想在体育竞争中取得成功,你就需要不断超越竞争对手。利用统计分析可以制定比赛的战略战术,也可以在比赛期间根据比赛结果随时加以调整。统计分析可以让管理者调整团队组成,可以让教练决定何时进行走马换将。

统计技术和体育专业知识深入结合才能得出好的方法。这需要数据分析人员和体育专业人士的精诚合作,在学术界和工业界的体育科学之间需要创造一个更开放的对话。最近澳洲的一项尝试说明这些障碍可以克服,并可以让学术研究人员和体育利益相关者一起工作。期刊《Quality Engineering》在2019年一篇文章详细描述了这种称之为Game Insight Group (GIG)的合作模式。我们给以简略介绍,从中我们可以看到统计分析在网球这个具体体育项目中的全面的应用。

澳网球协会和维多利亚大学各出资50%成立了GIG机构。在维多利亚大学内,GIG是健康与体育研究所下的一个研究项目组。在澳网球协会,GIG位于创新团队中,在GIG和澳大利亚网球协会的球员之间建立了直接的战略联系。

研究目标包括推进体育领域的统计方法、利用高水准的网球比赛数据建立有关网球比赛的知识以及为产品营销渠道提供科学基础。为了实现这些目标,它在以下主要领域获得了研究成果:赛果预测、度量指标开发、设备定制和策略研究。

首要任务是建立一种可靠和准确的预测比赛结果的产品。这项工作始于对现有比赛预测方法的大规模验证研究。该研究使用最近的职业网球比赛的样本测试,评估了11种已发表的方法的预测性能,包括分析方法、基于回归的方法和配对比较模型。最后选出的方法对比赛结果的预测准确率达到了70%。

提高比赛成绩的测量和评价是体育统计的一项基本任务,需要为运动比赛建立新的统计指标,这是这项任务的中心。确定了网球比赛的四个基本维度——心理、技术、战术和身体,目标是在这些关键领域建立有用的衡量标准。

对这项运动的心理方面的研究始于评估比赛压力下表情变化的研究。通过使用摄像机捕捉到运动员的表情数据,这项工作的结果不仅发现了关键比赛表情的可测量变化,而且确定了这种变化模式中存在的独特特征,表明在高水平运动员中存在独特的心理特征。

网球技术是指击球的质量。使用现代跟踪数据,能够比以往任何时候都更详细地测量镜头中的特征。网球的跟踪数据由组成网球击球轨迹弧线组成,每个弧线由三维空间中每个方向的三个多项式函数描述。从这些多项式可以很容易地导出在一个球的飞行期间的任何点。

网球战术是指运动员为增加获胜优势而做出的战略决定。击球选择是竞争策略的基本组成部分。关于击球策略有许多流行的想法,但很少有实证研究表明这些方法之间的相对有效性。为了解决这一研究差距,开发了一种使用多年跟踪数据的镜头分类法。构建分类的方法使用了基于多阶段函数型数据聚类的方法。结果显示,无论男子或女子比赛,发球和接球的击球类型都比之前描述的多。

网球运动员的身体状态被认为是赢得比赛和赛后发展的重要因素。传统的统计数据没有提供关于比赛的身体需求的信息,这使得研究人员使用比赛持续时间或比赛项目作为比赛强度的代理变量。由于现代跟踪数据包括运动员在整个比赛中的二维定位,它提供了一种开发关于运动员运动和效率的更丰富的统计数据的方法。沿着这些思路,开发了一个度量方法,度量比赛期间的能量消耗。这项统计包括运动员移动的距离,速度和加速度,运动的方向,方向的变化,变化的强度和身体质量。这些分析方法已经被开发成了产品供运动员和他们的团队选择。

可以使用市场上的一系列规格的球拍建立一个击球特征数据库。在一项试验中,参与者被随机分配一个包含10个球拍的随机样本。然后,参与者使用一个安装有多摄像头跟踪系统的场地,完成发球和接球的击球系统计划。收集到的击球数据提供了关于球拍性能的四个关键维度的信息:功率、旋转、控制和舒适度。这些数据与参与者的调查相结合,其中包括关于参与者用手、经验、身高、性别和年龄的信息。使用这些数据可以实现两个目的。给普通人可以提供一种合适球拍的最好建议。给专业运动员可以提供在不同场合不同目的使用不同球拍的建议。

管理机构制定了职业赛事的管理规定、赛季的结构,以及定义巡回赛锦标赛和比赛如何进行的规则。因此,管理机构的政策对这项运动的文化和这项运动的生态有着巨大影响。关于政策和规则的变化如何影响比赛的效果也是体育统计研究的课题。

体育统计不是一个新诞生的领域,但随着科学技术的进步很多完全新的课题涌现出来。本文简要介绍了体育统计或体育分析领域几个最新的应用案例。希望有更多的具有统计分析背景的学术研究人员和体育专业人士能一起合作,为体育事业发展做出贡献。

文章来自:期刊《中国统计》ISSN:1002-4557 年,卷(期):2021(8)