世界杯,无论是作为4年一届的伴有巨大利益产业链的全球**消费文化符号,亦或是其作为体育竞技所具有的转**众对尖锐社会矛盾视线的属*,不论你我是否情愿,成为这段时期全球**的互联网流量。正值2022卡塔尔世界杯火热进行中,希望能提供一个不一样的视角,带大家了解足球背后的数字化应用,

并将球队从垫底队伍转变为MLB联赛的有力竞争者(由Michael Lewis编撰成书《Moneyball》,并最终翻拍成同名电影,中文名《点球成金》,由布拉德·皮特饰演Beane)是棒球领域中最广为人知的故事之一,并成为了体育届Moneyball的起点。

那么在笔者的主观视角内,并在体育届有举足轻重地位的商业公司。

在英超97-98赛季时,在经历了多次跨集团的收购与合并后,如今Opta是Stats Perform集团下的子公司,为体育媒体和广播公司、技术公司、全球品牌、体育**、球队和联赛以及范特西体育游戏(Fantasy Sports)提供商提供服务,

以Opta作为切入点的一个重要原因是,这个观点会贯穿本文始终。

最常见的案例通常是监控页面浏览**和按钮点击**,关联上用户(人物)和**的相关信息(时间、所在页面、关键词)或标签来采集用户行为。由于用户行为本身是发生在信息系统之上的,用户行为本身就是一系列信息,

像游戏中常见的Kill、Da**ge、Death等等。

仅限射门、角球、进球、换人等关键信息,只能够记录到关键**大致的时间和相关人物。

而在这一时期,从上世纪50年**始,

得出许多建设*观点,其中最为**的是:大多数的进球都是通过少于三次的连续*传球形成的。因此他给出的战术建议是,持球时减少无用的横向传递,尽快将球快速向前推进。这个被称为长球理论的建议,衍生成了现如今大家所*悉的长传冲吊战术打法,盛行于英国当时的各家足球***。

信息系统的应用

随着IT技术的发展,2001年Opta率先淘汰了依靠纸笔记录的统计方法,开始转为人工为主的信息化采集。

覆盖在比赛**的视频上。传球路线成为了最为核心的工作内容。并标记出是谁接到的传球。

但不难想象,2D网格化的足球场是无法和第三人称视角的足球**画面中球场上的影像**对应,鼠标会移动到与**画面中的足球的位置距离较远的点上,还有各种技术*动作的判断,如是不是过人、是不是抢断、是不是失误等技术**的记录,

在这个时期,每一次传球都可以跟前后**相关联,

负责的主要工作是开发统计模型来预测足球结果,并为《泰晤士报》的每周专栏“Fink Tank”提供研究。

2010年以后,SportVU和Prozone是最早的掌握核心技术的公司之二。非常“巧合”的是,现如今这两家公司与Opta一同是Stats Perform集团下的子公司。

SportVU和Prozone均能够实现,在非人工参与的情况下,通过光学识别技术和球员追踪系统,记录下2000~3000种**。现如今大部分已被计算机视觉(CV)这种人工智能(AI)技术所取代。

光学识别技术与球员追踪系统的实现,在上一时期中,而对于球场上非持球的绝大多数球员是忽视的,

而现在可以实现对球场上所有球员的跟踪,以SportVU为例,不仅如此,并可实时传输到前台(如**),

SportVU于2009年3月被STATS LLC收购后,然而在2017年,以2.在NBA的失利迫使SportVU更加专注于足球,目前服务对象主要是欧洲足球***,国际足联和欧足联。

Prozone在2011年收购了足球行业另一家专注于球员跟踪与表现分析的技术公司Amisco后非常强势,在同Opta合并到同一集团下前一直与Opta保持激烈竞争。但在2015年成为Stats Peform集团的子公司后,逐渐被Opta和SportVU的光环埋没。

值得一提的是,在2021年,Second Spectrum被Genius Sports以2亿美元的价格收购。

而在光学识别与球员追踪的技术应用上,该公司会在后续篇章的相关业务中介绍。

虽然现如今光学识别和无线定位的相关技术已经广泛在职业赛场上和队伍训练中得到应用,很多人都以为足球作为最有价值的体育竞技项目,其**赛事和***拥有各种运动科技的技术支持,

虽然在**比赛中已经广泛应用上光学识别和无线定位的相关技术,人工记录仍然是不可替代的环节。即使**的技术系统能自动实现——识别足球场上分别是谁,当前位置,当前速度等一系列基础信息,但仍然难以辨别球员的技术动作、关键**或定*判断,比如射门和传球、越位进球、被犯规、失误等等。

已至于很多技术方案在设计之处,或从另一个角度看,即使未来技术发展,但各类**仍然难以用计算机语言去定义的话,那么最终的判断还是得由人来决定。

2014年,即使Prozone号称自己有比Opta更为**的光学识别与球员追踪系统,但Prozone的球员跟踪系统无法区分聚在一起的球员,更不能自动辨别重要的技术**。所以他们跟Opta一样,

2015年,在当时引起了圈内的一定讨论——仿佛玩家在玩**版足球游戏(FIFA/实况)。

光学识别和球员追踪系统是半自动的——系统可以自动识别球员,但不能解决关键**的自动化识别,

对于绝大多数职业足球赛事,包括但不限于WhoScored、Wyscout、Tran**erMarket、SofaScore、Squawka、SoccerWay等等。

球探、分析师和经理的对球员的分析评估工作由传统纸质报告向数字化应用转变。

并不涉及ESPN这样的体育媒体。

以WhoScored为例,甚至有专职分析师在赛后提供的比赛关键复盘信息。

专职分析师在赛后提供的比赛关键复盘信息,以及本场比赛所展现的打法风格或技战术安排。

Match Center模块,可以查询各项指标的选手评价,包含传球成功率,过人成功率,成功运球,远传,铲球,角球等等,可结合时间轴查看指定时间范围内的选手表现。

Chalkboard模块,可以查询各项技术**信息,包含射门,过人,运球,角球,失去球权,失误等等。像射门**,可按照球员、结果、区域、情境等条件进行筛选。

对于传球**,可按照球员、传球类型、距离、触球部位、起球区域、目标区域等条件进行筛选。

球员的主页上显示了球员球探报告的摘要。选择*展示了大约 20 个统计指标。这组统计指标涵盖了比赛的各个方面(进攻、控球、控球、防守等),可以应用于所有外场球员。

***转会与球员薪资

以球员转会费用、球员身价评估、转会相关信息和各路八卦流言为主要内容。以及球迷们专门交流“流言”的论坛。

在首页可以查询到最新的转会情况、**转会记录、合同延续、球员价值等焦点信息。

在最近转会记录中,不仅可以查询最新的球员转会情况,还可以查看最近的转会流言,Tran**er**rket用百分数的形式来表达该流言的可信度。

在球员页面上,

对比内容包含在球员页面提及过的所有信息。

当然,Tran**er**rket也提供了***维度的统计,包含***的基本信息、球场信息、历史荣誉、当前身价和当前联赛排名。用户亦可以在这查询***下属球员包含身价等一系列的信息,最近的流言,整体的转会收益和开支,具体引进球员与**球员的记录等等。

同样的,Tran**er**rket也整理了各大球队主教练的信息,包含基本信息、历史荣誉、当前执教队伍、喜欢的阵型风格、历史执教记录以及对应球队的基本成绩。

此外如果想要了解和薪资有关的内容,在视频结尾推荐一个叫capology的网站,可惜的是这个网站已经不能免费看所有的薪资窗口了,目前只能看五大联赛每个球队薪资**的五人以及合同的详细年份。

Capology是一家专门收集全球主要足球联赛的球员薪资和***球员开支信息的网站。总共收录近3+万的球员和***。薪资信息从、新闻、社会、行业专家多方收集, 并有专门的消息来验证这些全球球员工资的真实*。

用户也可以查询***整体的球员开支情况,Capology也提供了付费服务,包括提供更广的球员和***的信息(如乙级赛事),商用API接口,以及面向球探、***所定制的报告内容。

包括超过550000名球员和200多个联赛和锦标赛的资料。

Wyscout于2004 年在基亚瓦里(意大利)成立,主要客户是足球领域的相关专家(选手经纪人、球探、教练和分析师等)和行业组织(***、球探协会、协会/联盟、选手经纪公司等),

报告和API之中。像是第三助攻、丢球、拦截、传球到禁区、掩护队友等高级**,

Wyscout每周会上传超过2,000+场足球比赛。信息涵盖比赛队伍双方各阶段和随时间变化的得分期望、控球率对比、传球准确*、进攻压力强度,以及传球分析、进球场景分析、球员表现评价等等,非常全面。

从欧洲5大联赛(英超、德甲、西甲、法甲、意甲)到世界上最重要的青年锦标赛的比赛。这些标记带有具体的关键选手和技术**,当教练、分析师团队想要去研究竞争对手的球员或者挖掘潜力选手时,而是结合剪辑内容快速观看球员实际比赛表现(包括高光和失误),大大提高了调研效率。

当然,Wyscout会提供球员赛季表现报告,甚至可以查看指定球员本赛季在左边路的所有传球成功或失败的统计,以及通过每一次传球**的视频来帮助分析球员的球路特点。

Wyscout提供的服务不仅限于上述展示的内容。显而易见,Wyscout的收费也是非常昂贵的,像最基础的会员服务,其中包含每月2份报告和70分钟视频解析,年费用就高达270欧元。对于有大量报告和视频分析,甚至定制化需求的用户,显然价格是没有上限的。

顺便一提的是,2019年Wyscout被Hudl宣布收购。

Hudl是一家为教练和运动员提供查看比赛画面为主的解决方案的科技公司,主要客户是橄榄球(美式足球)以及其他运动(包括足球、篮球、排球和曲棍球)的青少年、业余和专业团队。

客户并不需要像职业联赛一样配置复杂的硬件设备,就能自动记录、上传赛事视频。视频会自动上传到Hudl系统,供教练和分析师实时调取查看。

Hudl提供了响应可自定义编程的平台,这样的工作内容被大量实践在***的训练赛当中。

如何让足球比赛更加公开公平公正

国际足联(FIFA)作为世界重大足球赛事的组织者,必然对其主办的赛事的公开公平公正承担**的责任和义务。近年来,国际足联也是在大力推动足球赛事领域数字化技术的应用落地,最为**的两大应用分别是视频助理裁判(VAR,Video Assistant Referee)和半自动越位技术(SAOT,Semi-Auto**ted Offside Technology)。

相关技术支持的主要公司是Hawk-Eye Innovations,自2001年公司成立以来,一直以来专注于体育裁判和广播增强技术。相比其他技术公司,公司最为出名的产品是鹰眼,相信绝大多数网球和羽毛球赛事的爱好者非常*悉这项黑科技在比赛场上的应用。

视频助理裁判(以下简称VAR)的主要职能是通过视频回放技术协助主裁判作出正确判罚决定。从2018年开始,逐步在各个中小型赛事上尝试VAR,并最终在2018俄罗斯世界杯上成功使用。

在遇到以下4种情况时,VAR团队会为裁判提供决策上的支持:

判罚决定和导致判罚决定的犯规(如点球)

在整个比赛中,VAR团队会不断检查与这4种情况相关的明显错误。VAR团队只与裁判沟通明显的错误或严重的失误**。

慢动作回放主要用于实际情况核对,例如,确定违规的身体触球部位或违规的地点。

可能有很多人误会,以为VAR仅仅只是某项技术,而实际上VAR是一整套包含人在内的技术解决方案。VAR团队由4名视频助理裁判和4名回放操作员组成。所有视频助理裁判(绿衣,FIFA派遣)都是国际足联**视频比赛**。回放操作员(黑衣,

为了保证体育场内和在电视或移动设备上观看的所有球迷都能对VAR团队审查过程有充分的了解,对于每场比赛,包括审查的原因和结果。

裁判最初判罚的准确度约为93%。而在使用之后,这组数字增长至98.8%,降低了82.8%的人为误判偏差。

在2022卡塔尔世界杯小组赛**对阵西班牙的比赛上,关于**队的第二个进球是否出界充满争议——因为从肉眼观察,很容易判定球出界了。球约有1.88毫米在界内(比赛规则以足球垂直投影于足球场的阴影判断)。虽然有争议(这个争议大部分源于**胜西班牙后对小组赛各队伍出线的影响),但在笔者眼中,本场比赛VAR确确实实挽救了一个世界杯的精彩进球。

技术升级使我们有能力对事实真相进行还原,而从另一个角度来说,足球黑哨的操作难度大幅升高,一方面是利益**不仅要影响主裁还要渗透VAR团队,

半自动越位系统(以下简称SAOT)是VAR团队和赛场裁判的支持工具,能够帮助他们做出更快、更准确的越位决定。在2022年卡塔尔世界杯,SAOT正式应用。

以每秒50次的频率计算其在球场上的确切位置。

其传感器位于球的中心,从而可以非常**地检测触球点。

SAOT会向VAR ROOM内的VAR团队提供自动越位警报。当进攻球员接触到球后处于越位位置时,其中越位线是基于球员四肢的位置所**计算得到。为比赛提供了更快、更准确的越位判断。

在球场上的裁判确认VAR团队提供的越位判断后,详细地呈现球员击球瞬间时四肢的位置。这个3D动画将显示在体育场的大屏幕上,以最透明的方式将越位审查信息呈现给所有观众。

在2022年卡塔尔世界杯**比赛日,阿根廷对阵沙特比赛中,上半场阿根廷的3次进球都被SAOT越位**,并被裁判判定为越位。“体毛越位”成为部分球迷们在本次世界杯的谈资之一,SAOT成功地实现技术出圈,VAR则再次成为众矢之的。

***在对球员进行日常训练的过程中,而在这种私密**强的场景(非开放日)下,绝大部分是freelancer。

“知己知彼”是体育竞技战略和战术设计的基石。像训练期间的**信息(比如训练新战术打发)无论是泄露给其他***、外部媒体或个别团体,都能对***造成*为负面的影响。另一方面的原因是,大部分情况下训练并不是比赛,当然还有成本等其他因素。

22财年的利润达到7700万美元,业务涉及40+种运动项目,

其自研的MatchTracker系统,与光学跟踪相结合,自动化标记球员在视频内的定位。热力图和运动轨迹等等。

下图是GPSports(Catapult前身)的运动分析工具的展示,通过运动员随身佩戴的GPS和心率跟踪设备,这类可穿戴设备不仅仅用于训练过程中。在正式比赛中部分队伍也会要求球员穿上,用于复盘。

教练团队可以全面地了解球员的特点。顺带一提,对其他***的球员只能通过外部方式来考察,但外部方式考察收集到的信息参考价值较低,一方面是能观测到的球员表现是在当前团队战术安排下所呈现出来的效果,另一方面是影响球员在比赛发挥时不好的因素可能有很多,例如球员有不为外部所知的伤病困扰、更衣室矛盾、客场压力带来的心理负担,甚至昨晚没休息好导致2026年2月30日状态不佳都是有可能的。

专业团队对职业球员的评价通常不会拘泥于球员在个别场次的表现,而是尽可能多的收集有效信息,而像球员转会这样的重要事宜通常有基于长期收集比赛样本和相关资料的分析报告作为参考。

通常分为两大方向:

其实对于***能提供的参考价值十分有限。即使现在,

比如进球,直接用以评价选手的进攻能力明显有欠妥当,毕竟每一个进球的难度显然难以相同。即使像WhoScored在球员指标上关联是团队进球数,来获得球员为团队进球贡献的占比,

比如2013年发布于《系统科学与复杂*学报》的一篇名为“CAPTURING COMPLEX, NON-LINEAR TEAM BEH**IOURS DURING COMPETITIVE FOOTBALL PERFORMANCE”的论文,得出了以下结论:

“调查表明了在比赛期间球队的(球员包围)面积和(多面体)结构是如何发生变化的。复合变量揭示了变化的不同趋势,证明了它们的互补*,可以将球队的行为描述为比赛中的复杂动态系统。本研究中使用的复合变量,包含团队的面积、拉伸指数、长度、宽度和几何中心,

球队所表现出来的(面积和结构)可变*往往并不复杂(即具有规律和可预测),但会随着比赛进程而逐渐增加变化幅度。仍需要进一步调查,以验证在国外其他职业足球队中该调查结果是否具有普遍*。”

对于这篇论文,笔者想引用2014年在英国体育分析创新会议上的一个反对声音——

1. 描述现状

仅笔者个人愚见,而应该对现实决策产生影响。脱离于行业实践,缺少现实的指导意义。

预期进球数xG

xG,英文全称Expected Goals,中文名为预期进球数,目前已被大量使用(如前文提到的各个网站和报告中)。来给到更接近真实进球难度的评估。可以让所有人直观感受到每次射门的机会质量,以及进球可能*。

从公开资料查询,该方法被部分人认为是最初的xG)。在2012年2月,Sam Green在对英超射手的评估中**次提及了“预期进球”。他写道:

“我们该如何量化球场上哪些区域最有可能进球,以及哪些射门最有可能进球?”

“如果我们能够建立(预期进球)这个指标,我们就可以准确有效地增加我们得分的机会,从而赢得比赛。通过防守球场的关键区域来限制对手更好的进攻机会。”

Green提出了一个模型来确定“射门命中目标和/或得分的概率”,考虑因素包含了与球门的距离、射门角度、脚球还是头球等8种场景条件,由此得到最初的期望进球的线*回归模型,用于计算在特定比赛情境下从球场上的特定位置得分的可能*。

当下Opta专门自研的Qwinn AI来实现期望进球数的计算。Qwinn AI能够结合多达35种不同的射门场景条件,包括有效射门角度,射门时与所有对方球员和守门员的位置与角度等等。射门场景下所有对射门具有影响的可观测因素都会被记录,并得到0.04xG的结果。0.04xG代表AI判定该射门只有4%的可能*射中。

如果进球数大于xG,代表这名球员能超过期望水平获得进球,且差值越大越好,反映着球员在射门这项能力上的出色,反之亦然。Opta基于xG的方**上又延展了xA,代表期望助攻数,核心思想上相似。

在Understat和Fbref上都可以查询到选手和队伍的期望进球数。

可帮助用户快速查询和筛选关键信息。

虽然Opta没有公开更多关于他们的期望进球数具体是如何实现的信息,

AWS(A**zon Web Services)作为后起之秀,是Opta的有力的竞争对手。

用于自动光学跟踪球员和球的位置。几乎所有的比赛**,包含点球和射门,并发送到DFL系统。同时现场有专门的工作团队,通过人工注释器对特定情况的信息和**进行分类和补充。最终,然后在全球范围内分发以进行广播。

查阅AWS机器学习*客可了解到,为实现传球效率,AWS专家使用机器学习(ML)模型来构建一种可以随时计算每次传球的成功率/难度分数的算法。

其中包含历史上的成功传球和不成功的传球。接球手、控球的位置、传球的持续时间和距离),但对不成功的传球知之甚少,因为它根本没有到达预定目标。

因此,AWS团队采用了 Pascal Bauer 和 Gabriel Anzer 于2021年在论文 Data-driven detection of counterpressing in professional football 中提出的一种方法,当传球不成功时使用球的轨迹和运动模型来判别预期接球手,

足球必然遵守物理定律。通过使用 William Spear**n 和 Austin Basye 在2017年提出的物理模型,可以使用传球后的前0.4秒来演算出球的整个运动轨迹。

在对球的轨迹进行建模后,我们可以知道它估计会落在哪里。下一步是计算谁可以到达球。该运动模型主要基于玩家的速度和方向,可以评估球员在指定时间内所能到达的区域。最终可以可视化地为每个球员周围画上四个圆圈,代表他们分别在0.5、1、1.5和2秒内可以到达的区域。

计算每个球员的潜在运动范围,并与球的预估着陆位置进行比较,来确定哪个球员可以先到达球,并判定该球员大概率是传球的预期接收者。通过上述方式,

AWS训练了一个能够实时计算每次传球的传球成功概率的监督型机器学习模型。在每个传递**计算 26 个传递特征,其中包括球与接球手的距离、中间防守球员的数量、球员承受的压力等等。然后将这些特征输入并训练机器学习模型,

南丁格尔玫瑰图展现了球员的传球习惯,包括主要传球方向和对应的分布。例如球员到目前为止尝试的长传和短传次数,困难传球次数,

在Bruce Schoenfeld 发表的 “Liverpool show Moneyball works in soccer, too”,和羽则专栏的《一个能造核弹的团队,却帮利物浦买人卖人》这两篇文章,包括他们相中克洛普(Jürgen Klopp)教练并说服管理层将他引援到利物浦,团队核心成员如何加入利物浦,他们与教练团队如何配合,以及他们挖掘了哪些球员并为***带来巨大收益。有兴趣的朋友可以去了解。

在2017年麻省理工学院斯隆体育分析会议上发表了题为“Physics-Based Modeling of Pass Probabilities in Soccer”的研究论文。

在这篇论文中,Spear**n定义了一种球场控制(Pitch Control)模型。球场控制定义为“假设球在这个位置,球员可以控制球的概率”。

通过沃罗诺伊图(Voronoi Diagram,又名狄利克雷镶嵌),Spear**n将场地划分为不同区域。在计算球场控制区域时,划分区域的判定标准是球员到达球所花费的时间来,而不是他们与球的距离。代入球员的**速度和加速度计算他们需要多长时间才能达到目标,并引入不确定*的变量(毕竟众所周知,足球中没有什么是确定的),计算出不同球员对球的控制区域。如下图所示,球的落点属于蓝色方的控制区域。

另一个被考量的重要因素是球的运动。球的速度和方向也影响了球场控制的计算结果。此外,并非所有控制区域的价值都是相等的。例如,对方防守背后的空间比守门员面前的空间在有控球权时更有价值。

“控制力”是球员控制球的概率,90%的情况下球员不到一秒钟就可以控制触球。

通过物理学的方式可以计算出分别需要多长时间才能到达“拦截点”,并使用Sigmoid函数可以将其转换为拦截概率。

所有这些因素结合起来计算出每个球员获得传球的概率,从而全面了解传球可能在何处以及由谁获得。

“得分机会模型”使用到球门的距离和在当前时间范围内得分的概率,而“无球得分机会”突出了得分链中下一个球可能来自的球场区域(通过将球场控制乘以球场上每个点得分的概率得出)。然后可以使用所有这些信息构建得分机会图。

接下来一切都变成了进球概率,3%这个值代表着,在接下来的15秒内,球从当前位置进球的概率。

1.比赛期间教练可以在替补席上通过平板电脑查看模型分析,比如看到球场上可以创造机会的区域,以及球队易受攻击的区域。

2. 在赛前和赛后作为分析中很重要的组成部分,给到教练作为参考;

3. 分析英超联赛中的所有球员以及世界其他联赛的大部分球员,了解哪些球员表现优异,寻得未来可能的签约机会。

并不能面面俱到。笔者主要希望能提供一个不同的视角,带大家了解足球背后的数字化应用,欢迎各路同好交流讨论和批评指正。

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。