竞技体育大数据的发展趋势金年会体育

发布时间：2022-10-12 13:15:15　　点击量：

　　早在1944年，就有人意识到数据对棒球运动的潜在影响，并对其进行了相关研究。布鲁克林道奇队的数据分析员阿兰-罗斯在《生活杂志（LIFE Magazine）》上发表“告别旧思想（Goodbye to Some Old Baseball Ideas）”一文中分享了“上垒率”这一重要数据的作用。彼时，数据分析在竞技体育业内还难称主流，对球队的训练管理影响有限。

　　2002年，MBL联盟的奥克兰运动家队利用数学建模方法挖掘、招募球员，打造了一支预算总额低，赢球效率极高的球队，于当年获得了联盟传奇的20连胜，拉开了职业体育行业广泛应用数据分析的大幕。迈克尔.刘易斯在次年所著的《点球成金》这部畅销书以此故事原型，将竞技体育中的数据分析推上了神坛。

　　无独有偶，2006年德国世界杯1/4决赛（德国VS阿根廷）点球大战前，助教塞给德国门将莱曼的“锦囊妙计”帮助莱曼延续了德国门神的传奇。据传，这张后来在拍卖会上拍出100万欧元的天价“锦囊”内容如下：

　　德国的数据分析团队赛前已对所有阿根廷球员近期罚点球的行为进行了统计分析，并将阿根廷队员的射门习惯汇总成了莱曼手中字字珠玑的精华，这才有了莱曼在点球大战中正确判断了所有点球方向，并奋力扑出两粒点球的神勇表现。一张纸条，不但决定了两支顶级国家队的赛场命运，也为大数据走进竞技体育行业打响了关键一枪。

　　经过数十年的积淀，赛场数据已今非昔比，仅一场比赛的数据就是TB量级，10分钟的训练就能产生近千万个数据点。通过深入挖掘体育数据中的潜在价值，对竞技体育项目的排兵布阵和具体技战术形成关键指导这一思路早已在业界生根发芽。体育大数据生长、爆发的沃土早已形成。

　　大数据正在对体育俱乐部及赛事运营单位、装备及系统制造商、科研及运动医疗机构、媒体、运动员乃至观众群体带来重大的影响和改变。大数据及以数据为依托的先进技术将使竞技体育的训练、恢复、赛场技战术安排、赛事运营、装备系统开发产生深刻变革。

　　本文将集中探讨体育产业大数据的核心之一——竞技体育比赛大数据展现出的三大趋势进行探讨。

　　随着技术的进步，赛场上技术台的数据维度早已不再局限于早期的“得分、篮板、助攻、射门、时间……”这类简单易得的统计数据。以NBA赛场为例，全联盟30只球队中，已有25只使用了SportVU系统。该系统利用六台高速摄像机以每秒25帧的速度记录球员在场上的位置坐标(x,y)和球的位置坐标(x,y,z)，将最早的初阶数据的数据维度进行了极大的拓展，将“一对一防守成功率”、“球员持球次数及时间”、“跑动距离及速度”、“球员受助次数”、“某一球员对特定球员的助攻成功率”、“运球次数”等等非常复杂的统计数据纳入了系统。数据维度爆发式的增长为基于数据的技战术安排、训练安排、科学研究提供了坚实的基础。

　　美国职业棒球大联盟（MLB）下属的媒体公司MLBAM应用StatCast系统将实时数据和视觉特效结合，将曾经用于追踪导弹的雷达用于捕捉棒球的运行轨迹和速率，以近乎实时的速度将棒球的球迹和球速展现在观众画面之中。惊艳的特效背后是每场赛事7TB的海量数据，一个赛季的数据量可达17PB。给观众带来震撼观感的同时，为球队和球员的技战术训练提供了丰富的数据支撑。

　　可以预见，随着穿戴设备和体育器材的不断智化，各型传感器和监测设备将逐步覆盖运动员的穿戴装备和赛场器材；在未来相当长的一段时间内，体育大数据的数据维度和数据量仍将持续高速增长，体征数据（心率、血压、血氧）、环境数据（天气、场馆地面、球门、球框）、装备数据（场上运动员的装备及能力）乃至运动员的心态数据都将逐步涌现出来，为训练、备赛、体育科研提供数据原料。

　　受限于技术发展，早期的竞技体育数据集中于初阶数据，初阶数据是对运动员在场上某一特定动作产生的明显结果进行的统计金年会体育，特定动作的结果往往有明显的“非黑即白”的性质，比如投篮，只有命中或未命中，结果直观，易于统计。对于棒球这种节凑稍慢，场上大部分情况均能通过初阶数据量化的运动，基于初阶数据的分析还尚可。但对于足球、篮球这样节奏、变化极快的攻击性运动，这种静态的初阶数据作用就捉襟见肘了。缺少对过程的清晰描述，初阶数据往往只能告诉教练员和运动员“你们该做什么”，而无法告诉他们“你们该怎么做”；并且在大多数情况下，无法客观反映初阶数据表现较差的运动员的真实贡献。

　　业界学者为能更加客观反映球员或球队的能力，根据以往经验对初阶数据进行计算、调整，形成高阶数据。比如棒球中的“全队效率”，通过对安打数H、被4坏球保送次数BB、投球中身次数HP、垒打数TB、打席数AB、得分数R、自责分ER、三振出局次数SO等初阶数据进行分析，整理成关于全队效率G的公式，用以估计攻防双方的实力差异。

　　篮球赛场上PER（球员效率值），作为另一个著名的高阶数据，其公式的复杂程度堪称经典。先综合运动员3分、2分、助攻、命中率、罚球、篮板、出手数、抢断、盖帽等数据，并根据联盟平均水平做修正，得出未修正的uPER：

　　通过与其他运动员的比较、自身特点的校正，高阶数据比初阶数据在客观评价运动员和运动队能力方面已有了长足进展；即便如此，高阶数据仍是一组反应球员、球队的能力状况的状态数据，这种静态的数据对快节奏攻击性竞技项目的技战术安排仍无法起到直接有效的帮助作用，依然不能回答“该怎么做”的问题。

　　如今，由SportVU、StatCast等系统提供的海量的赛场实时数据使得动态的大数据分析成为可能。在篮球、足球、冰球这些快节奏、攻击性强的竞技项目中，对动态的过程数据分析应用已成为业界发展趋势，数据对战术安排的支持作用变得日益明显。

　　通过对SportVU系统提供的海量比赛数据和训练数据进行汇总分析，DanCervone和Alexander D’Amour等人提出的“预期球权价值法（EPV）”给了业界一个动态的量化观测技战术的手段，为实时技战术安排提供了重要的依据和参照。同时也为更加公平的观测球员对比赛的贡献提供了新的思路。

　　EPV是一个条件期望——即在某一时刻根据球员和球的状态，预期的攻方得分值。某一状态下的EPV是对未来时刻所有路径的加权平均值。根据对场上的宏状态和微状态拆分，EPV的公式如下：

　　宏变化是指在进攻过程中所发生的传球、投篮、失误这三类较为巨大的状态改变，一切在相同运动员同一次持球过程中发生的变化称之为微变化；公式由加号连接的前半部分是宏变化对EPV的影响，后半部分是微变化对EPV的影响。

　　在计算各宏状态的期望值时金年会体育，应用马尔科夫链（Markov Chain，一种给定当前状态的情况下，预测将来状态的数学方法）；在计算各宏状态的条件概率时，应用“竞争风险分析”（Competing risks，计算在连续时间内某竞争事件出现的概率，对于竞技体育，竞争事件指“失误”）和“条件协变量”（situational covariates，比如在持球队员和队友间出现对方防守队员的状况）两种方法。如下图（宏状态的静态分析）所示，2号球员Leonard持球时，下一时刻他有5个潜在的宏状态，他可以选择自己投篮，或传球给其他4名队友。每个彩色的箭头表示Leonard的下一个宏状态选项，箭头的粗细代表Leonard这样做的可能性，箭头的颜色代表这样做对EPV值的贡献（由灰至红，依次由低到高）。每个宏状态的选项都对应着不同的EPV值和概率值。这样，队员和教练在做战术分析时，对每个进攻状态都能做到有数据支撑的精确战术安排。仅就此例来看，Leonard最好的战术选择是尽快分球给底线号Green（红色箭头），这样做对EPV的增加值最高，即进攻成功的期望值最高；而不是选择概率与之相同的自己投篮进攻（灰色箭头）。

　　对于公式后半部分，即微变化部分，通过对各个宏状态的EPV差异分析，进行时域和空域的平滑（Space-time smothness）。将宏状态和微状态的变化影响相结合，即可分析出一次进攻过程中每位球员的贡献如何。以下图为例TB体育，图中展示的是马刺队的一次进攻。该过程有一次宏状态变化，两个连续的微状态变化过程。

　　在状态2时，Parker杀入篮下，EPV已飙升至1.36（从状态1至状态2的变化过程为连续的微状态变化过程）；

　　而帕克在状态3时，选择传球给左侧三分线外的Leonard，鉴于Leonard较稳定的底线三分球技术，此时EPV飙升至1.75（此过程持球人改变，发生宏状态变化）

　　Leonard得球后，对方快速移动过来防守他，使得EPV下降至1.6（此过程为微状态变化），最后Leonard投篮命中。

　　最后得分虽由Leonard完成，但Parker突破、分球的贡献，Duncan挡拆的贡献均被统计在内，甚至连对手防守所造成的影响也可直观展现。这样一来，每位球员对每次进攻的帮助作用就会变得一清二楚。

　　而从对战术指导的角度来讲，即便最后Leonard的投篮没有进，本次战术安排也是基本合理的。可以看到，除因防守队员快速补防造成的EPV下降外，本次进攻战术执行过程中没有任何由进攻方的选择而至的EPV下降，这说明在战术安排上的挡拆、突破、分球都比较成功，队员的每个动作选择都是在为进攻做“正功”。如果结合类似上一张图中的宏状态的静态分析，我们或许会对这次战术安排有更清晰的解读，可以看到Parker的突破、分球两个状态选择是否都是最佳选择。

　　EPV通过对每位运动员在场上的每个举动对每次进攻的贡献进行统计，非常清晰的量化出了整个进攻过程。

　　足球与篮球虽然同为“侵略性游戏”，但与篮球不同，足球在传球过程中的传球时间较长，球员需要通过控制球的落点区域来增大传球成功的可能性，传球过程中被抢断的风险更高，因而找到足球中传球成功的可能性、攻防双方所控制区域的威胁性变得尤为重要。

　　针对足球的这种特性，澳大利亚的Joachim Gudmundsson和Michael Horton提出了通过沃洛诺伊图法来估算各方优势，合理安排战术。沃洛诺伊图的思路非常简单，空间中到某个给定点的距离小于到其他任意给定点的距离，符合这个条件的全部点集，构成了给定点A的优势区域。对空间中的这些给定点，分别按照一定的规则两两划中垂线，中垂线所构成的图会形成网状的沃洛诺伊图。以任意时刻场上的运动员为给定点集，以球场为给定的空间区域，按沃洛诺伊图法则可形成每个运动员的优势区域。沃洛诺伊图画法如下：（蓝色虚线为任意两点连成的线段，边框内的红色线段为各条虚线的中垂线。）

　　将足球场按照各个时刻的状态按沃洛诺伊图法划分，即可看出每位队员所控制的区域、攻方队员的优势区域、守方阵容的薄弱环节。以下图为例，红方进攻队员A和B控制了大片前场区域，且距离蓝方球门较近，对蓝方球门区域形成了巨大威胁，暂不考虑其他影响因素，此时最优的传球目标是红色A球员区域和B球员前方的大片开阔地。

　　足球比赛中的沃洛诺伊图是依据时序时时刻刻都在变化的，实时追踪每个时点的沃洛诺伊图计算量极大，实现困难。因而在沃洛诺伊图的原理基础上进行调整，是十分必要的。研究人员通过研究每名球员在给定时间内可达到的范围加以判定，会使计算量减小千倍左右，但准确性同时会有所降低。同时由于受运动员的极速、加速度、惯量等参数的影响，沃洛诺伊图的实际应用还比较有限；但它较为清晰的展示了运动过程中，优势区域变化的过程，同样也给了业界一条量化展现全部进攻过程的思路，对战术的选择和决策形成了较为有效的支持。

　　三金年会体育、智能化技术的影响下将催生新的比赛数据研究方法，推动竞技体育的开展以数据为依托的技战术变革

　　传统的技战术研究思路以录像和初阶数据为主要依据，动作统计设备和算法的制约使得传统技战术研究和论证缺乏有效的量化工具，效率之低下可想而知，教练员“敏锐”的洞察力成为战术选择的最重要支柱。

　　海量而精确的体育大数据为未来的智能化训练和战术安排提供了一片沃土。运用机器学习和模式识别等先进算法和技术，智能化的战术分析已成为趋势。

　　AveryMcIntyre等人运用SportVU系统提供的海量数据建立并验证了一套针对“挡拆”这一战术的学习分类器，自动识别了过去四个赛季以来发生的27万多个挡拆，并通过数据跟踪和监督机器学习将“挡拆”策略准确地分成了“挤过（over）”、“绕过（under）”、“包夹（trap）”、“换防（switch）”四类。进而对防守各队重点球员的挡拆策略进行了分析：

　　研究结果展示了联盟中各位球员面对上述几类防守策略时的表现。以James为例，在面对“换防”、“挤过”、“绕过”绕过这三种挡拆防守策略时的每回合的平均得分分别为0.83、约0.9、和约1.0，这也就意味着，普遍来讲防守James最好的策略应该是“换防”。对于James这样一位本赛季场均出手20.11次，总决赛场均出手30多次的“重炮”来说，这样的分析结论无疑是十分有价值的。

　　SportVU等系统和智能化技术的广泛应用，使得上述对基于特定战术动作的初阶数据统计成为可能，针对任意特定状况的战术选择有了强有力的数据支持。NBA、MBL这样的职业大联盟中，大部分球队均有专门的数据分析人才，随着对SportVU系统所提供的海量数据的深入研究，类似的研究结果将层出不穷，教练在安排战术时，参考这些数据分析将是十分必要的。金年会体育金年会体育

上一篇 : 缩短研发时间全球最大的汽车玻璃专业制造商金年会体育下一篇: 金年会体育tb体育中国股份有限公司

返回列表

友情链接：

电话：http://www.sdcdwd.com/uploads/allimg/20190418/288c553ae608d0a4385cf05bd8a55634.jpg
手机：江西省南昌市
QQ：