数据分析是垃圾?莫雷PK巴克利 浅谈斯隆峰会

2015-03-07 06:25:34 来源: 网易体育
0

今年2月11日,火箭在客场以127-118击败太阳。TNT解说嘉宾查尔斯-巴克利称火箭和太阳是联盟中防守最烂的球队。对此,火箭官方推特列出了一长串的数据来回击巴克利。火箭总经理莫雷也在推特上向巴克利发炮:“在现场看球的好处就是——可以不用听到巴克利在TNT上血口喷人、哗众取宠。”



“大嘴”巴克利怎么可能咽得下这口恶气,他开始对莫雷与其代表的数据分析开炮:“我可不会在乎莫雷怎么说,他是那些相信数据分析的白痴之一。首先,我一直以来都坚信数据分析就是垃圾。数据分析一点用都没有,这只是一些聪明人为了参与比赛而编造出来的垃圾,原因就是他们没有运动天赋。”

巴克利还声称他的说法得到了一位匿名NBA主帅与小牛队老板马克-库班的支持。但讽刺的是,库班却是数据分析年度盛典——MIT斯隆体育分析峰会的常客,他从2009年至2013年连续参与了5届。

ESPN的三位专家将巴克利反感数据分析的原因归结为对未知的恐惧。因此,莫雷在今年的MIT斯隆体育分析峰会结束后,以“欢迎巴克利来参加”结束了双方的口水战,他希望巴克利能够眼见为实。

那么究竟什么是MIT斯隆体育分析峰会?2006年,一些对于数据分析有着浓厚兴趣的志同道合之士为了加深彼此对于体育的理解,在波士顿麻省理工斯隆学院举办了一次集会。经过多年发展,如今MIT斯隆体育分析峰会已经成为了数据分析行业的年度盛事。与会总人数从第一届的150人左右涨到了如今的3000人以上。会议入场券票价高达575美金,却一售而空、供不应求。

每年二月底、三月初,体育数据分析行业的精英汇汇聚一堂,进行一场巨大的头脑风暴,MIT斯隆体育分析峰会堪称数据分析极客们的“华山论剑”。亚当-萧华、菲尔-杰克逊等篮球界巨擘都曾是此峰会的座上宾。关于体育分析的海量观点、想法、研究结果会在峰会中展示出来。在这里,或许一篇论文、一句评论便能掀起某项体育的一场革命。

一、MIT斯隆分析会对NBA的影响

休斯顿火箭目前以41胜20负的战绩位列西部第四,堪称联盟中的劲旅。但本赛季的大多数时间,火箭的核心阵容只是哈登与一群联盟平均水准的角色球员。为何天赋平平的火箭在本赛季能打出高效的进攻水准(106.4的进攻效率,联盟第12)?原因便是火箭的进攻策略。



火箭是联盟中最痴迷于三分球进攻的球队,至今他们共投出了2062记三分,领先第二位骑士390球之多。照着这样的趋势下去,赛季结束后火箭将成为NBA历史上单赛季投出三分最多的球队。同时,火箭是中投最少的球队,他们在10-16英尺区间与16英尺-三分线区间的出手比例分别为4.6%和6.5%,皆为联盟最低。

给球队制定这个策略的是总经理达里尔-莫雷。莫雷2000年硕士毕业于麻省理工斯隆学院,他是个不折不扣的数据狂人。作为NBA数据分析领域的泰斗级人物,莫雷是MIT斯隆体育分析峰会的奠基人与组织者之一。

自2011年以来,投篮选择的议题便出现在了MIT斯隆体育分析峰会上,专家们得出的结论是——远距离中投是篮球运动中最低效的进攻手段,同时三分球是回报最高的投篮方式。从此,莫雷执掌下的火箭开始将三分球作为最重要的进攻手段。其他球队或许没有火箭疯狂,但增加三分球、减少中投的出手比重确实已经成为了全联盟的趋势。

本赛季,全联盟远距离中投投得最多的三支球队是尼克斯、湖人和森林狼,他们是联盟中战绩最差的几支球队。赛季开始前,湖人新任主帅斯科特表示:“我不信三分球能带来总冠军。”但是近年来的总决赛上,三分球纪录每年都在被刷新。近几年的冠军球队——小牛、热火、马刺都十分依赖三分球。似乎,事实跟斯科特所持的观点不符。

上个月底,ESPN评选出了所有球队对于数据分析的依赖程度,尼克斯与湖人都处于完全不相信数据分析的球队行列。值得一提的是,去年仅有湖人一支NBA球队没有派出专员参加MIT斯隆体育分析峰会。处于大都市的几支球队却如此守旧,的确令人感到意外。

发生在火箭队身上的进攻变革验证了竞技体育中数据分析的巨大作用,但仍有许多人不愿承认火箭的成功应该归功于数据分析。巴克利表示:“他们得到了哈登、霍华德,后来还得到了阿里扎、约什-史密斯。让他们赢球的是优秀的球员,而不是什么垃圾数据分析。”这话也有一定的道理,谁都知道若想赢得总冠军,必须要有联盟前10或者前20的巨星球员。在姚明和麦蒂离开火箭后,莫雷也清楚地了解火箭需要一个巨星球员。但球队不愿摆烂获得高顺位选秀签,那么只有通过交易了。莫雷开始通过数据研究,寻找被低估的球员。于是,他瞄准了雷霆的替补分卫詹姆斯-哈登。在今年的MIT斯隆体育分析峰会上莫雷透露,当时火箭为了得到哈登愿意“付出一切代价”。事实上,火箭每一次慧眼识珠的背后,都是莫雷的数据衡量系统。

自从莫雷在2006年创立MIT斯隆体育峰会以来,数据分析对球员选秀、签约、合同的指导作用便是峰会的长久议题。手无缚鸡之力的极客莫雷之所以能够成为NBA球队的总经理,也正是因为这个能耐。火箭或许是联盟中发掘低顺位新秀最优秀的球队,斯科拉、兰德里、海耶斯、布鲁克斯、帕森斯等成功案例不计其数。而且多年以来,火箭大多都能保持攻防均衡,有着足够竞争力的同时却能控制住球队预算。虽说莫雷的许多运作看起来精打细算得有些过分,但也绝对能称得上成功。

二、NBA进入大数据时代

巴克利在怒喷莫雷的时候说道:“你看马刺有个毛数据分析?”事实上,马刺在今年的MIT斯隆体育分析峰会荣获了本年度最佳数据分析组织奖……同时,马刺总经理RC-布福德还荣获了终身成就奖……

RC-布福德在2013年出席MIT斯隆体育分析峰会时,曾谈到波波维奇对待数据分析的态度:“我认为波波维奇对这些数据支撑的、不是传统篮球哲学的领域很有兴趣。他开始问很多不同的问题。”马刺在健康分析方面是联盟的领导者,他们会根据弹弓体育的GPS追踪科技来决定是否让球员轮休、降低训练强度。而且,马刺是最早采用SportVU技术的四支球队之一。

SportVU技术,在体育数据分析领域中是一项革命性的技术。它诞生于2005年,由以色列科学家麦基-塔米尔发明,原本被用作追踪导弹。2008年,美国的STATS公司收购了SportVU,将精力集中在篮球数据分析。2009-10赛季,小牛、火箭、雷霆和马刺成为了联盟中最先采用该技术的球队。随后的三个赛季,采用SportVU技术的球队数涨到7支、10支、15支。如今,NBA收购了这项技术,全联盟所有球队都在使用。

在每座球馆的上空会悬挂着6个超高清摄像头,每秒钟能够抓取25帧图片。这些摄像头采集到的数据通过复杂的计算公式与比赛的play-by-play数据同步,能够在90秒内便发回报告。每个球员的每个动作、每次传球、每次投篮、每次触球……一切的一切都被记录了下来。

2013年,NBA对于数据分析越来越看重,他们设立了stats.nba.com网站,专门为球迷们提供数据查询。当初,这个网站所有的历史数据加起来都不到1TB。而SportVU的球员追踪数据单论上赛季,数据量便已高达80GB。海量的数据就是无穷的宝库,如今专家从样本中挖掘到的结果只是沧海一粟。去年的MIT斯隆体育分析峰会上,4篇与篮球相关的论文全部立足于SportVU追踪技术。可以说,SportVU就是高端篮球数据分析的未来。

NBA显然意识到了这一点,在上个赛季收购了这项技术,联盟中30支球队中都装上了设备进行运用。在stats.nba.com上,NBA也开始提供部分的SportVU数据供球迷们分析研究。本赛季,stats.nba.com上的数据变得越来越详尽。在上个月,NBA甚至与数据公司Synergy达成了了协议,开始在stats.nba.com公布Synergy的部分基础数据。

NBA总裁亚当-萧华上任以来极为开明,他广纳建议,在两年内已作出了许多改革。萧华已连续两年出席MIT斯隆体育分析峰会,这能显示出NBA对数据分析的态度。

三、小记2015年MIT斯隆体育分析峰会

1、或许将改变联盟制度的一些想法

出席的亚当-萧华先生可要万分留意了,在峰会上的一个小小概念,都可能在未来让NBA产生天翻地覆的变化。

萧华在发言中多次表态,愿意对联盟的现有制度进行大刀阔斧的改革和创新。萧华甚至透露,他对季后赛淘汰制度的改革持开放态度,将考虑学习NCAA的单场定胜负淘汰制。萧华表示:“在我看来,大学篮球之所以会如此让人兴奋和疯狂,很大程度上和他们的淘汰制有关,一场定胜负,就统计学角度看,你看比赛的热情肯定会高涨。所以我认为,我们应该考虑。”

此外,萧华还指出现有的选秀制度也应考虑改变,因为越来越多的球队为了追求高顺位选秀权会选择摆烂的丑陋行径。事实上,如何阻止摆烂早已是MIT斯隆体育分析峰会的议题之一。莫雷作为MIT斯隆体育分析峰会的组织人之一,对摆烂也十分反感,在前几年火箭挣扎的时候,他们也不会故意摆烂,因而多次成为乐透冠军。今年,莫雷也在会上炮轰了现行的选秀制度。

凯尔特人助理经理迈克-扎伦在今年的峰会上提出了“车轮式”选秀的概念——设30年为一个周期,让每支球队都拥有平等的选秀机会。他还提出了5年一轮回和10年一轮回两个方案。对此建议,萧华表示:“我认真想了一下,感觉不错,这可以让(摆烂)问题迎刃而解。”

莫雷也在本次会议上也向萧华提出了一个建议——交易应变条款。莫雷举了哈登的例子来解释这个提议:“在交易哈登时,可以有这样一条条款——‘若他将来成为了全明星,火箭应该多给雷霆一个首轮选秀权;若他没有,雷霆则应退回一个选秀权。’这种条款能让很多交易变得更顺畅。”莫雷认为此举能大幅减少交易双方对风险的恐惧。

2、数据分析对球员的影响

前NBA球员肖恩-巴蒂尔在今年的MIT斯隆体育分析峰会上抢尽了风头,ESPN将他称为会议首日的MVP。在峰会开始的第一天,他就在三个不同的分会上进行了演讲,大谈自己对数据分析的看法。



巴蒂尔一直以来都被认为是NBA中最聪明的球员之一。《点球成金》的作者迈克尔-刘易斯表示:“巴蒂尔是一只跟实验家一样了解实验的小白鼠。”刘易斯曾在《纽约时报》上撰文分析过巴蒂尔。他回忆道,火箭只会将对手的球探报告与数据分析给巴蒂尔浏览,因为巴蒂尔是唯一一个能消化这些信息的球员。

巴蒂尔身体天赋平平,却成为了联盟中最优秀的侧翼防守球员之一,这跟他热爱数据分析有着密切的关系。对对手进攻方式的细致了解,能让巴蒂尔在防守中表现更为出色。在今年的峰会上,巴蒂尔表示他对安东尼的进攻喜好早已铭刻于心,因此他在对位中会有防守上的优势。事实上,安东尼是巴蒂尔职业生涯封盖过最多的球员,巴蒂尔表示:“安东尼每次望向我的眼神都带着杀气。”

巴蒂尔透露,在热火时期他时常会给队友支点招。“他们的反应就好像刘姥姥进大观园一样。”巴蒂尔还透露,勒布朗-詹姆斯对待数据分析的态度会比其他球员更开放。事实证明,勒布朗近年来在场上不断地调整自己的出手选择,在接受Grantland的采访时,他曾告诉记者“中距离投篮是得分效率最低的得分手段。”证据表明,包括勒布朗在内,越来越多的教练和球员开始对数据分析产生兴趣。

巴蒂尔认为:“数据分析是(帮助球队)的一种工具,就跟跳投和力量训练一样。”前NBA主帅麦克-丹东尼表示:“数据分析能让我在夜里睡得更香。”巴克利啊,你应该找这些人说理去。

但我们要从辩证的角度来看问题,任何事物都有他的双面性。巴蒂尔表示,过度相信数据分析会夺走球员的创造力。“我对好坏的选择变得十分敏感。我失去了了我所有的创造力。我在2012年只投进了一个油漆区外的两分球。”看起来,大量的数据信息会让球员在场上想得更多,而变得畏首畏尾。

3、精华研究成果介绍

今年的峰会上,8篇论文将进行研究成果报告。其中有2篇是与篮球相关的,其中一篇讨论防守能力的量化,另一篇讨论化学反应的量化。2篇篮球与会论文的数量创造了近年来的新低,但这并不是一个坏消息,这证明在其他的运动领域上,数据分析扮演的角色都越来越重要。

峰会在今年选出了2篇最佳论文,获奖者将分享高达三万美元的的奖金。其中一篇是4名哈佛博士做出的NBA防守数据研究,以下为大家进行简单介绍。

对位得分:NBA防守的高级衡量标准

得分、助攻、进球数、命中率等,绝大多数的数据统计都注重于进攻端。我们能够轻松地查到1985-86赛季谁的总得分最高(阿历克斯-英格利什的2415分)、1991-92赛季谁投的三分最多(弗农-麦克斯维尔的473记)。但若我们想查2013-14赛季谁阻止的投篮最多,却一无所获。

我们多年来衡量防守的标准一直都是抢断和封盖,但它们都不能很好的反映球员的真实防守能力。抢断,或许是以冒险性防守为代价的,在抢断失败时,可能会因为失位而影响到球队防守;而封盖的价值,或许还不如篮下一次有效的垂直起跳。ESPN在近年来设立了真实正负值的算法,可以以此刨去场上其他因素的干扰,单纯分析球员在场上的影响力。但这个数据仍然不够具化,它不能解释球员在防守端如何或为何能够做到高效。我们总说保罗是NBA最出色的外线防守球员之一,但我们却没有任何的图表和高端数据来证明这个说法。

数据统计已经如此发达,但却只有大约10%的数据与防守直接挂钩,而防守却占据了NBA比赛中的一半。多亏有了SportVU追踪系统,让防守终于可以得以量化。哈佛的四位博士——亚历山大-弗兰克斯、安德鲁-米勒、卢克-伯恩、柯克-高德斯贝里经过接近两年的努力,终于成功建立量化防守表现的数学模型,并将其可视化。他们通过计算防守的对位和时间,最终得到了以下几种量化防守的数据或图表。

1.防守量级:单防者防守的出手次数数量级。

2.防守干扰度:单防者能成功干扰出手的比例。

3.防守热点图:体现单防者在球场各个位置的防守数量与质量的可视化热点图。

4.吓阻力:每100回合单防者防守总出手次数的加权平均值。

5.对位得分:每100回合单防者防守对位总得分的加权平均值。


上图是上赛季哈登与莱纳德的防守热点图。六边形的大小代表防守出手数的差异,体现了对位投篮的频率;六边形的颜色代表防守干扰度的差异,体现了对位投篮的效率。明显可以看出,上赛季的哈登在三分线外与禁区内的防守能力极为糟糕,而莱纳德是位出色的外线防守球员。


再来看看保罗与德隆-威廉姆斯上赛季的防守热点图对比。我们终于可以清晰地看到保罗的防守能力究竟有多出色。保罗的图表满布蓝色小点,这表明了:1、他极大地压制他对位球员的出手次数;2、他极大地降低了对位球员的投篮效率。相比较,德隆在弧顶与45度角的三分防守能力实在令人不敢恭维。事实上,保罗上赛季在限制对位球员出手次数方面,位列联盟第一,所有人都不想在保罗的防守下出手。与所有的侧翼球员相比较,哈登上赛季的对位球员总出手次数是最多的……

必须指出的一点是,这个数据模型考量了对位球员的基准数据,修正了对位球员能力对该数据的影响。这意味着,保罗无论是防守着的库里还是朗多,都有极佳的效果。


通过对比联盟中3位优秀内线防守球员的防守热点图,可以发现一个有趣的现象:邓肯、希伯特、霍华德在油漆区都是一片蓝,代表着他们的防守效率都极为出色。但是霍华德在内线防守的出手次数却极少。这反映了两种震慑禁区的方式:希伯特直接干扰,霍华德间接威慑。

在去年的MIT斯隆体育分析峰会上,数据专家柯克-高德斯贝里就提出了“霍华德效应”的概念。尽管封盖等防守数据不出彩,但魔兽在油漆区有着无人匹敌的威慑力,所有人都不愿杀入有霍华德坐镇的禁区。而希伯特则是另一个极端,他在上赛季防守着最多的出手次数,步行者似乎将所有的进攻球员都送到了希伯特的五指关下,他共干扰了41.9%的出手,联盟第一。

将防守能力量化的意义十分重大,这让人们能够更加清晰地了解一名球员的价值。许多防守型角色球员或许将因此得益,巴蒂尔、托尼-阿伦是他们的典型代表。他们数据不出彩,在场上的价值被低估。有了这些数据,他们或许能收获更多应有的褒奖和更大的合同。

结语:无论巴克利的话说得多么难听,他也无法阻止数据分析在NBA的发展趋势。亚当-萧华出席MIT斯隆体育分析峰会并广纳建议,也代表着联盟对数据分析的态度。数据分析究竟是不是垃圾?取决于你是不是一个装睡的人了。

欧阳焱 本文来源:网易体育 作者:欧阳 责任编辑:王晓易_NE0011
用微信扫描二维码
分享至好友和朋友圈
x
无障碍浏览 进入关怀版