网易数研所与CBA冠军神同步 国内数据缺陷在哪?

2017-04-12 21:48:02 来源: 网易体育
0

网易体育4月12日报道:

新疆夺得队史首冠过去近一周,关于CBA的话题渐渐沉淀下来,大洋彼岸的NBA进入常规赛最后冲刺,季后赛大幕即将揭开。和世界第一篮球联赛NBA相比,我们的CBA联赛还差的太远,自1995年联赛诞生至今22年,虽然从上至下出现过各种各样的问题,但总体仍在不断进步。这样的进步不仅体现在球员、主帅的能力,新的总冠军不断涌现和越来越好的观战氛围,也体现在幕后的方方面面。

延伸阅读:

新疆夺冠背后的数据支持 1份报告50页如博士论文

今年关于CBA最大的新闻除了新疆夺冠,是姚明接任篮协主席,大刀阔斧的对中国篮球和CBA联赛进行改革。作为曾在NBA奋战多年,一度成为NBA顶尖中锋的球员,姚明深知NBA积淀60余年的经验能为我们这个仍处在童年阶段的联赛带来什么。俱乐部的职业化、市场化,球员的自由流动,这些都是姚明上任后亟待解决的问题。

另一个变革在姚明上台之前就在悄然进行中,那就是CBA如何迎接大数据时代。

网易CBA数研所关于周琦的数据分析研究
网易CBA数研所关于周琦的数据分析研究

最近新疆主帅李秋平接受了媒体采访,其中谈到最多的是球队在备战中对数据的运用。目前CBA联赛的所有球队都配备了数据分析团队,这些数据包括基本的得分、篮板、助攻,球员在场上的投篮点,也包括高阶的球队/球员攻防效率,进攻/防守要素,以及对手球员主要的的进攻方式和采用每种进攻方式的得分效率。

如果球迷们常看NBA的数据分析文章,就能发现高阶数据几乎可以运用于一名球员的方方面面。通过这些数据我们可以知道:库里命中率最高的三分投射方式是挡拆后撤步,得到哈登传球后命中率最高的队友是卡佩拉,勒布朗沉低位背打为外线队友创造的机会最多,从这些数据里我们能大致勾勒出一支球队的基本进攻战术,以及可能发生的种种变化。

而在CBA因为条件限制,我们无法使用SportVU追踪系统(需要大量的高速摄像机捕捉球员动作),因此我们缺少了诸如球员跑动距离,触球、传球次数等关键数据。好在从14-15赛季起,网易体育已经开始相当一部分的高阶数据统计,通过这些数据,和小编针对单场比赛的“人工synergy基础数据”,基本同步了今年新疆夺冠的整个过程。

网易CBA数研所:

G1,网易体育追踪了周琦、布拉彻、易建联、布泽尔四位CBA顶尖内线的混战,其中球员得分、篮板、封盖等数据是现成的,真正让人感兴趣的还是四人究竟谁对位谁的进攻成功率更高,易建联、布泽尔又应该用什么样的方式突破周琦的防守。尽管数据显示周琦面对易建联仍很稚嫩,但布拉彻的统治级演出已经为新疆夺冠埋下了伏笔。(G1复盘:4大内线咋互撕 周琦PK阿联还太嫩 )

G2,李根突然爆发成为赢球关键。网易体育赛后追踪了李根当场的全部出手,他在场上站的位置在哪儿,和队友之间的互动如何,以及广东防守战术的变化。因为西热力江首战命中7个三分,广东的外线防守注意力转移,又因为双塔的杀伤力惊人,李根这个本应该被严防的点被战略性松掉,那场比赛李根的主要进攻方式是定点投篮,没有面框也没有背身,这和布拉彻、周琦的高低位战术需要内线空间直接相关。(LBJ-根如何用三板斧劈死广东? 杜锋G3只剩一条路

在总决赛前,网易CBA数研所已得出新疆的实力优势。一则新疆内线对抗占优,二来新疆外线三分点太多,周鹏一个防守铁闸根本不够用。(总决赛前瞻:高阶数据+阵容深度被完爆 疆粤决广东机会在哪? )而后广东G3再败,李根继续爆发,因为周琦有伤在身,李秋平安排李根增加了面框打法,冲击广东内线收获奇效。

以上数据来自网易独家高阶数据后台
以上部分数据来自网易独家高阶数据后台

这些变化,一部分来自李秋平执教多年的经验,另一部分就来自他身后的数据分析团队。直至新疆4-0夺冠,才有媒体开始挖掘这些背后的故事,毕竟大数据时代到来已经是不可逆的趋势,那么,国内的高阶数据缺陷又在哪?或者说,我们还有什么值得探究的空白区域。

国内数据的缺陷:

首先,中国篮协作为各大网站的数据来源依然不稳定,哪怕在总决赛中也出现过只有球员号码,没有球员姓名的乌龙,每一场比赛CBA的数据都是从赛场统计员临时上传到篮协,各大网站再从篮协官网转录,因此一旦某个环节出现问题,就会出现网站只有视频/文字直播,数据栏缺失严重,甚至一片空白的情况发生。

其次如前所言,我们的CBA赛场并没有安装SportVU系统,这个系统是NBA各项高阶数据的基础。因为有他和该系统背后的数据团队,NBA比赛一结束就能通过专门的数据网站查询到这一场某位球员触球多少次,传球多少次,用什么样的进攻方式拿了分等等数据。而在当下的CBA,我们仍需要人工统计这些高端数据,然后套入公式计算,不过分的说,NBA用完善的系统瞬间就能得到的数据,我们需要长达数个小时对着比赛录像一点点统计、核对才能做出来。

最后,在NBA还有一类数据基于每一场的Play-by-Play,该系统的作用是纪录球员在什么时间节点做了什么,投了篮,抢了篮板,送了助攻,甚至犯了什么样的规,以及球队在哪一节的几分几秒换了什么人,通过这个系统,我们能直观得出一支球队哪一套阵容在场得分效率最高,用数据来证明为什么“布拉彻+周琦+李根+西热力江+亚当斯”是新疆的最强五虎。

NBA的每场比赛都有专门的数据录入员在场边做这个工作,而CBA现场缺少的就是这样的工作团队。必须承认,这个工作相当繁琐,需要全场注意力高度集中,网易体育曾在2014-15赛季总决赛中尝试赛后针对录像去整理,单单一场比赛就耗费了超过十个小时。(2014-15赛季CBA决赛第3场play by play统计

play by play数据页面
play by play数据页面

综上所述,CBA大数据的时代到来了,但距离熟练运用还很遥远,各支球队已经开始使用这些数据做球探报告,媒体也在不断尝试做更高阶,更精准的专题报道,但一则我们需要付出的时间和精力是NBA的数倍,二来从繁复异常的数据海洋中总结出自己需要的数据也有相当高的专业需求。但CBA想要进步,这个过程就是必须要经历的,网易体育作为国内最擅长运用篮球高端数据的媒体,也时刻期待着姚明上任之后几年内,能让CBA的数据系统,再朝着NBA的标准靠拢一些。

本赛季网易CBA数研所其他数据研究一览:

NBA和CBA的"双布"对决 高阶数据世界里谁更强?

莫雷想看的周琦数据都在这 他离NBA还差什么?

本土LBJ靠2招"焦作人" 逮谁碾谁!郭帅拿他真没招

节奏之争?首轮最快PK最慢1组对位或定疆辽生死

德比之战看利矛破坚盾 要逆袭广东?深圳只有1招

数据揭外援关键表现:普莱斯坑小丁 哈神让位郭少

数据揭本土关键先生:郭少真大腿 小丁为何隐身?

丁神MVP实至名归! 高阶数据另类对照NBA=状元级

高阶数读列强:丁神或率山东爆冷 辽疆沉迷单打

高阶数读球员:700万先生丢掉3分包 继伟逆袭郭少

如何争8?数据告诉你北京"烂"在哪4旬老马要背锅

丁1哥凭3张图拽下阿联 姚主席为保他革外援的命?

数据告诉你小丁持球攻有多强 或超朱八争最强小前

马必乐 本文来源:网易体育 作者:刘跃进 责任编辑:马必乐_NS4800
用微信扫描二维码
分享至好友和朋友圈
x