美赛MCM C赛题分析,助你更好的应对考题

美赛,即美国大学生数学建模竞赛(MCM/ICM),以其深远影响和挑战性的使命而著称。在这一竞赛中,参赛选手需要在短短四天的时间内,与两名队友紧密合作,完成指定问题的建模、求解、验证以及论文撰写工作。

 一、 问题 C  真题

网球中的“势头”问题

  在2023年温布尔登男子决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉斯击败了36岁的诺瓦克·德约科维奇。这是德约科维奇自2013年以来在温布尔登的首次失利,结束了这位大满贯历史上最伟大的球员之一的辉煌历程。      这场比赛本身是一场引人注目的较量。德约科维奇似乎注定要轻松获胜,因为他以6比1的比分轻松拿下了第一盘(赢得了7场比赛中的6场)。然而,第二盘局势紧张,最终阿尔卡拉斯在抢七局中以7比6获胜。第三盘是第一盘的反转,阿尔卡拉斯以6比1轻松获胜。当第四盘开始时,这位年轻的西班牙人似乎完全掌控了比赛,但不知为何,比赛再次改变了方向,德约科维奇完全控制了局势,以6比3赢得了这一盘。第五盘和最后一盘开始时,德约科维奇从第四盘开始就占据了优势,但再次发生了方向改变,阿尔卡拉斯获得控制权并最终以6比4获胜。比赛数据包含在所提供的数据集“2023-wimbledon-1701”中。您可以使用“set_no”列等于1来查看第一盘中德约科维奇领先时的所有点数。球员似乎占据优势时发生的令人难以置信的起伏,有时甚至包括多个点数或比赛,这通常归因于“势头”。
      字典对势头的定义是“通过运动或一系列事件获得的力量或力”。在体育比赛中,一个团队或球员可能会感觉到他们有势头,或者在一场比赛中的“力量/力”,但这种现象很难测量。此外,也不清楚比赛中的各种事件是如何创造或改变势头的(如果存在的话)。

任务:使用所提供的数据:

1、开发一个能够捕捉比赛进程中点数出现的模型,并将其应用于一场或多场比赛。你的模型应该能够确定在比赛的特定时间哪位球员表现更好,以及他们的表现有多好。根据你的模型提供可视化效果以描述比赛进程。注意:在网球比赛中,发球方有更高的概率赢得这一分/局。您可能希望以某种方式将这一点纳入您的模型中。

2、一位网球教练怀疑“势头”在比赛中不起任何作用。相反,他认为比赛中的起伏和一名球员的成功是随机的。使用您的模型/指标来评估这一说法。

3、教练们想知道是否有指标可以帮助确定比赛的走势何时从有利于一名球员转变为有利于另一名球员。

利用至少一场比赛提供的数据,开发一个预测比赛走势的模型。哪些因素可能最相关(如果有的话)?
考虑到过去比赛“势头”波动差异,您如何建议一名球员在与不同球员进行新比赛时采取行动?

4、将你开发的模型应用到一场或多场比赛中进行测试。你的预测结果有多准确?如果模型有时表现不佳,你能否找出需要纳入未来模型的因素?你的模型对于其他比赛(如女子比赛)、赛事、球场表面以及其他运动(如乒乓球)的适用性如何?

二、试题分析

赛题分析:C题是美赛MCM中的一道大数据赛题,涉及网球运动的高维数据分析。解决这道题需要进行以下步骤:

数据收集与预处理:整理比赛中的各种数据,包括发球方、得分情况等。对数据进行描述性统计分析,处理缺失值和异常值,并进行初步的可视化分析。

势头定义与量化:确定如何量化势头,可能包括连续得分、破发等指标。可以采用熵权法和层次分析法相结合的改进模型进行量化评价。

统计分析:使用统计方法分析势头与比赛结果之间的关系。采用统计相关性分析方法,包括皮尔逊相关系数分析、多元统计中的典型相关分析等方法,还可以利用线性回归中的回归系数进行比较。

模型建立:基于历史数据,使用机器学习或其他统计模型来预测比赛中的势头变化。针对分类变量可以采用logit回归、xgboost、lightGBM等方法进行交叉验证,通过比较ROC曲线、混淆矩阵图评估机器学习的预测效果。

验证与调整:使用新的比赛数据测试模型的准确性,并根据结果调整模型。比较开发模型在新数据集下的预测效果,并对机器学习模型参数进行调整。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注