Chinese_ConceptNet.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chinese_ConceptNet

Chinese ConceptNet iAgents Lab Introduction 常識(即 commonsense,多數人共享、一般非專業的知識)是人們間溝通、 解決難題的基本要素。不幸的是, 雖然現代電腦的運算能力與儲存容量均急遽 成長,電腦的「沒常識」卻是一個眾所週知的缺陷。欲將數百萬筆人類知識轉換 成機器可處理的格式的確是一件費時且昂貴的工作。經過二十五年的努力, OpenCyc 2.0 甫於 2009 年七月正式推出,其知識庫含 47,000 個「概念」,以及 306,000 筆知識工程師悉心編撰的「事實」。 相對的,MIT 媒體實驗室的「開放常識」計畫於十年內順利的從一萬五千 名使用者貢獻了超過百萬筆英文句子。目前,兩個知識庫的內容均以英文為主, 而且還極不完整。本研究計畫挑戰多語言常識知識庫的資料蒐集、驗證、與推理 技術的開發,以期改善常識資料的涵蓋度、正確性、以及有效推理的能力。尤其 是,本研究將旨在結合機器學習技術與具生產力社群遊戲來建構一個中文的嘗試 知識庫。前者自動從非結構式與半結構式線上文件擷取出結構式知識;而後者則 累積線上社群遊戲玩家的常識。所產出的知識庫可能含有錯誤或矛盾的語句。 Our Knowledge Base 中文為世界上最多數人口使用的語言。在東方世界中,也存在著不少常識, 非常值得我們去蒐集與應用。根基於英文版本的 ConceptNet,我們建構專屬於中 文的 ConceptNet。並藉由數個遊戲以及熱心人士的貢獻,來擴增我們的 ConceptNet-Zn,並維持其常識的可信度與品質。 截至目前為止,中文 ConceptNet 擁有超過 60 萬個常識句子,僅次於英文版 本的 100 萬個。相信在不久的將來,中文版的數量可以到達 100 萬個。我們仍致 力於增加遊戲的娛樂性,以吸引更多的使用者。 Example – Chinese commonsense about “紙”: /web/concept/zh_TW/紙 AnalogySpace AnalogySpace is the reasoning technique used in ConceptNet. AnalogySpace Matrix The AnalogySpace matrix represents each concept as a feature vector. The feature of a concept is its neighbor and the relation. For example, has fur and capable of flying are features of bird. Figure 1. Example of feature for concept bird. The assertions in our knowledge base (e.g. Chinese ConceptNet) can be converted to the AnalogySpace matrix. The rows in AnalogySpace matrix are concepts; the columns are their features. Each entry is associated with a real-number value which is the number of collected sentences for an assertion. Figure 2 is part of the AnalogySpace matrix. Figure 2. Part of the AnalogySpace matrix. Semantics of AnalogySpace Matrix For any two rows in the AnalogySpace matrix, we can find that the sentence in an inference rule can be replaced by other sentence and gives plausible inference results if the two sentences have similar truth assignments for the same feature. For example, the sentences PartOf(fur, cat) and IsA(cat, pet) in modus ponens rule can be replaced by PartOf (fur, do

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档