以资料挖掘技术探讨职业棒球选手表现差异之研究.docVIP

以资料挖掘技术探讨职业棒球选手表现差异之研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
- 以資料挖掘技術探討職業棒球選手表現差異之研究 黃謙順 文化大學資訊管理系 cshwang1902@.tw 王祖傑 文化大學資訊管理系研究所 089020@.tw 摘要 職業棒球是一項精密且講求團隊合作的運動,隨著資訊科技的進步,由電腦所產生的各項統計數字對職棒場上球員調度乃至球賽勝負有重大的影響。所謂知己知彼百戰百勝,然而職棒場上各項統計數字種類繁多,在眾多的統計資料中如何找到資料及資料間的關連性,進而了解球隊的勝敗因子,是一個值得探討的問題。 和一般企業一樣,所有的職業運動均以達到企業利潤最大化為營運目標,當一支球隊成為常勝軍時,常因此得到較多球迷的支持,也為球隊帶來較好的收入,因此,追求高勝率對一支職業棒球隊而言是一件重要的工作,大家時常討論一支常勝軍應具備哪些特徵值?是高打擊率、低防禦率還是固若金湯的防守,本研究利用日本職棒元年1936年至2005年球季例行賽之資料,建立日本職棒之勝利函數模型,探討各種球員不同之生產因素(打擊、投球、防守)對球隊勝利之影響程度。 雖然由比賽所產生的統計數字項目眾多,但我們在評量一位選手的表現時,仍缺乏一個全面性的指標來顯示選手對球隊勝利的整體貢獻度,進一步來說,兩位各有所長的選手,一位打擊率高,一位全壘打數多,我們該如何來評斷誰對球隊的整體貢獻度較高?此外相同的選手相同的表現,若分處於不同的球隊或聯盟,我們是否對他的評價會有所不同?我們該如何來評量他們對球隊勝利的整體貢獻度?這也是一個值得思考的問題。 要從未知且大量的資料中找出規則,必須要用適當的技術,資料挖掘是一種從大量資料中,透過工具擷取有用資訊或知識的技術,透過這樣的技術能將資料轉換成知識,這些知識也就是資料間隱含關係的具體表現與呈現。 本研究資料來源為日本職棒官方出版的The Official Baseball Encyclopedia 2004 日本プロ野球記録大百科[第四版],將此百科中各年度各聯盟所有球隊的年度戰績、投球記錄、打擊記錄及防守記錄統合整理後,建立成一個資料庫,並深入將所有己得的成績,利用棒球場上的數學公式,產生新的統計數字,以使記錄變得更多元化,並將收集的資料欄位細分化、重點化以完成資料前置處理。 本研究選用Index Miner軟體進行資料挖掘的工作,利用資料挖掘技術中的分類迴歸樹演算法(Classification And Regression Tree, CART),以找出日本職棒七十年來的勝利函數模型,分類迴歸樹是決策樹演算法中可用來進行預測且對一系列的現有數值來預測一個連續數值的可能值,有助於本研究建位勝利函數模型。本研究函數產出項為球隊勝率,投入項分別為選擇打擊、投球、跑壘及防守中重要之統計數據為變數。 本研究所得到的勝利函數模型,將幫助球隊了解自己球隊獲勝的因子,在新人選秀、年底交換選手及挖角補強時可做為重要的參考指標,進而為球隊帶來勝利及利潤,此外,本研究將幫助球隊了解選手對球隊勝利的整體貢獻度,更重要的,在職棒記錄的世界中,這個勝利函數模型,能客觀的比較同一年或不同年的選手表現差異,可做為選手在職棒世界歷史貢獻的指標。 關鍵字:資料挖掘、Index Miner、CART、日本職棒 壹、緒論 職業棒球運動是一種精密且講求團隊合作的運動,經由比賽所產生的各項攻、守記錄,對球隊比賽有著重要的參考價值,更進一步來說,這些攻、守記錄,隨著資訊科技的進步,可以來分析及評斷球隊的需要及選手的價值。 和一般企業一樣,所有的職業運動均以達到企業利潤最大化為營運目標,當一支球隊成為常勝軍時,常因此得到較多球迷的支持,也為球隊帶來較好的收入,因此,追求高勝率對一支職業棒球隊而言是一件重要的工作,大家時常討論一支常勝軍應具備哪些特徵值:是高打擊率、低防禦率還是固若金湯的防守?然而一場比賽所產生的攻守記錄相當的多且複雜,每一種統計成績對於球隊的勝敗都有未知的影響程度,在眾多的統計資料中如何找到資料及資料間的關連性,進而了解影響球隊的勝敗因子,是一個值得探討的問題。 職業棒球選手有好的表現就能得到好的待遇,和企業論功行賞相當類似,美國職棒有名的選手Alex Rodriguez早在2003年時,年薪已超過2000萬美元,是目前全世界最高年薪的職棒選手,但2001年到2003年他所屬的球隊Texas Rangers總成績為216勝270敗,勝率僅0.444,3年間在美國聯盟西區排名最後一名,戰績不佳的球隊中卻出現全聯盟最高薪的選手,這是一個有趣的現象,也代表了相同的選手在不同的球隊,其評價對球隊勝利的整體貢獻度應有不同的做法。 雖然由比賽所產生的統計數字項目眾多,但我們在評量一位選手的表現時,仍缺乏一個全面性的指標來顯示選手對球隊勝利的整體貢獻,進一步來說,兩位表現相同的選手,若分屬不同的球隊,我們該如何

文档评论(0)

44422264 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档