构建一个中文国小数学文字问题语料库.PDF

构建一个中文国小数学文字问题语料库.PDF

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
构建一个中文国小数学文字问题语料库.PDF

The 2016 Conference on Computational Linguistics and Speech Processing ROCLING 2016, pp. 352-371  The Association for Computational Linguistics and Chinese Language Processing 構建一個中文國小數學文字問題語料庫 Building a Corpus for Developing the Chinese Elementary School Math Word Problem Solver 繆慎耘 Shen-Yun Miao 中央研究院資訊科學研究所 Institute of Information Science Academia Sinica ja ckymiu@.tw 林素朱 Su-Chu Lin 中央研究院資訊科學研究所 Institute of Information Science Academia Sinica jess@iis.sinic .tw 馬偉雲 Wei-Yun Ma 中央研究院資訊科學研究所 Institute of Information Science Academia Sinica ma@.tw 蘇克毅 Keh-Yih Su 中央研究院資訊科學研究所 Institute of Information Science Academia Sinica kysu@.tw 摘要 本篇論文提出了一個理想數學文字問題語料庫所應具備的特性,並敘述我們如何建置一 個完善的中文國小數學文字問題語料庫:其過程、所標註的內容、以及遭遇的困難。求 解數學文字問題是自然語言理解在人工智慧領域的一個常見應用。近年來有關於英文數 學文字問題的研究,都是以機器學習的方法為主。但不論是執行機器學習,或比較不同 的解題系統,都需要一個完善的語料庫。目前國際上雖然已有數個公開的英文數學文字 問題題庫,但他們所收錄的數學題庫多偏頗於自家解題系統的特性,難以公平評估各系 統的真實性能。而在中文方面,迄今尚無任何一個公開的數學文字問題題庫可資使用 。 為了能有一個可供研究使用的數學文字問題語料庫,並修正前述英文題庫之缺失 , 我們建立了一個頗具規模的中文國小數學文字問題語料庫。此語料庫原始資料是由台灣 三個國小教科書及參考書的出版社所授權提供。為完整提供所有的數學文字問題題型及 352 內容,我們僅僅清除了無關解題的垃圾符號,並不增刪原始內容,以完整呈現文字敘述 之原貌。此外,我們還加註了額外的訊息,並在部分題目上標註題型和語言分析,以助 研究者瞭解數學文字問題之特性及建立模型。 本語料庫是第一個完整的中文國小數學文字問題語料庫。依各個年級分類,含有數 種補充資訊,便於評估各解題系統的解題能力

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档