论文部分内容阅读
体育比赛的胜负结果不仅取决于竞技双方的实力,还存在很大的不确定性,这种随机性使得胜负和比分的预测十分困难。近年来,很多研究者希望借助于比分的预测研究来加强人们对于复杂对象的理解。其中,概率统计方法被广泛应用到在胜负预测中:首先建立一个用于预测的模型,该模型根据当前球队的实力,计算比赛预期的胜负概率;然后通过球队之间的历史战绩数据进行训练,根据实际的比赛结果按照模型的实力更新规则计算出球队新的实力值。但是目前的方法主要是在队伍的级别上进行预测,没有在球员的级别上进行细化。实际上,因为球队之间的比赛就是队员之间的对抗,通常情况下队员的能力值在攻防过程中往往会起到关键性的作用,决定比赛的胜负,但队员的发挥,上场时间,伤病情况,转会等因素也会对球队的实力造成影响,所以这些因素也不应该忽略。对比赛中的攻防情况和队员能力值建立合理的因果关系,从队员的能力值级别上进行建模,利用得分,命中率,篮板,抢断,失误等多个数据指标去对球员的能力进行评估,建立较为复杂的贝叶斯网络模型,考虑了球员上场时间,发挥等因素,并使用EM算法对球员能力参数值进行学习,然后用测试数据集进行比赛预测验证,以达到预期的效果。针对上述问题,提出了一个混合的模型:利用潜在变量建立一个比赛模型,得出在提倡比赛中,对手得分机会的期望值;利用一只团队的成员能力与得分之间的概率图模型,建立一个得分模型,得出不同队伍将得分机会转化为得分的期望;将二者结合起来,就可以预测比赛的得分。因此,并不是单纯地直接对胜负进行预测,而是通过概率统计的方法通过对历史详细战报进行分析,通过建立合理的概率图模型,对球队球员的各项能力值进行评估,并对比赛中每一次攻防过程中的得分情况进行预测。使用NBA的比赛真实的比赛详细战报数据集,能有效的评估出球员的能力值,并且发现对球员能力值粒度细化的模型在比分预测应用中比粗粒度的模型更加准确。