2017“贝贝网·种子杯”编程PK赛-初赛题.pdfVIP

  • 34
  • 0
  • 约2.95千字
  • 约 5页
  • 2019-04-18 发布于广东
  • 举报

2017“贝贝网·种子杯”编程PK赛-初赛题.pdf

1 2017”贝贝网·种子杯”编程PK 赛 — 初赛 2017”贝贝网·种子杯” 初赛试题 2017/9/23 *本次最终解释权由大赛组委会所有 *更多详情请访问大赛官网 /seedpk/ 2 2017”贝贝网·种子杯”编程PK 赛 — 初赛 1 赛题描述 Dian 团队小点同学特别喜欢观看篮球比赛,他收集了很多场学校篮球比赛的数据。他想 利用这些赛前数据来预测某场比赛两队的胜负结果,请大家一起来帮小点出出主意,使用任 何技术 (规则、回归、分类)来做一次预测吧。 2 数据描述 本赛题包含5 个数据集,所有文件均为UTF-8 编码存储的逗号分隔值文件(如遇到excel 打开乱码请自行百度解决方案),文件内容如下: teamsData.csv : 各个球队队员的前赛季数据。(发布时给出) matchDataTrain.csv: 球队之间的比赛训练数据。(发布时给出) matchDataTest.csv: 球队之间的比赛测试数据。(测试集在26 号给出) predictPro.csv: 各个参赛组预测的需要上交测试的结果。(自己生成需要提交的内容) predictPro_template.csv: 输出文件的样例版,全1 输出。(提交的样本文件在26 号给出) teamData.csv 该文件包含上个赛季各个队伍队员的各项数据指标。部分数据如下图所示: 特别注意以下数据: 投篮命中率:所有投篮的命中率(包括罚篮) 投篮命中个数:所有投球次数(包括罚篮) 投篮出手次数:所有出手次数(包括罚篮) matchDataTrain.csv 数据包括比赛对阵情况,有主客场队名,两队比分以及本场比赛之前的主客场战绩。部 分数据如下: 3 2017”贝贝网·种子杯”编程PK 赛 — 初赛 matchDataTest.csv 测试数据给出主客场队号,以及本场比赛之前战绩,需要预测主场球队赢得比赛的概率 (置信度)。部分数据如下: predictPro.csv 测试数据提交结果,0-1 的数值表示主场赢得比赛的置信度。部分数据如下: 3 初赛任务评价指标 初赛题以AUC 指标来评估预测模型的优劣,计算公式如下: AUC 物理含义: 假设分类器的输出是样本属于正类的score (置信度),则AUC 的物理意义为,任取一 对(正、负)样本,正样本的score 大于负样本的score 的概率。 符号含义: M 为真实结果中正样本数,N 为负样本数,rank 为将预测概率升序排序后正样本的排 序位置。 AUC 计算示例: 4 2017”贝贝网·种子杯”编程PK 赛 — 初赛 y_true = [0,0,1,1,0] y_pred = [0.1,0,2,0.3,0.5,0.4] 排序后: y_true = [0,0,1,0,1] y_pred = [0.1,0.2,0.3,0.4,0.5 ] M = 2 , N =3 ( ) ( ) Auc = 3+5 − 2 ∗(2+1)/2 = 0.8333 (两个正样本的概率分别rank1 = 3,rank2 = 5) 3∗2 使用问题: 建议自己查阅相关资料,按照上述公式写出测试函数,或者可以借用scikit-learn 中AUC 的计算函数(此处方法不同,结果略有差异),裁判组最终测试以上述公式为准。 4 作品提交相关 4.1 预

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档