陈华钧OpenKG:愿景与挑战.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
陈华钧 OpenKG :愿景与挑战 本文改编整理自浙江大学计算机科学与技术学院教授陈华钧在杭州首届金融知识图谱论坛上的报告。 关于论坛首先作为承办方之一,也代表浙江大学,欢迎各位的到来。特别感谢白硕老师和所有的嘉宾百忙之中抽空过来支持这次论坛。 刚才桂林教授已经介绍过,我们组织这类论坛的一个主要目的是促进跨领域的交流,让知识图谱能更多地在垂直领域落 地。传统的 KG 仍然局限于搜索引擎和 Bot 问答,并以百科类常识类知识图谱为主。 但我们相信 KG 会逐渐渗透到更多的垂直领域。金融则是十分有希望也备受关注的垂直领域之一。 另外这次论坛,我和鲍捷还有一个目的是希望宣传“开放” 对于 KG 发展的重要性。丁力和鲍捷都是语义网和 KG 领域十分资深的专家, 现在也都在创业。 如果讲 KG 怎么构建,我们经常会去争论是该以 Top-Down 的方式去设计构建, 还是该以 Bottom-Up 的方式从粗糙数据中去总结和抽取。我相信他们俩可以争论三天三夜。但有一件事情,特别是做语 义网出身的朋友, 我们不太会去争论, 就是“开放” 对于 KG 发展的重要性。实际上每一个真正深入到 KG 这个领域的 人,都会或早或迟地意识到开放对于 KG 发展的价值和意 义。 我的报告也因此分为三个部分:先谈谈 KG ,再谈谈 Open, 最后谈 OpenKG 。我会从 KG 的发展历程、内涵概念、构 建方法等多个角度,并通过一些事实来引证说明我们发起 OpenKG 这个项目不是因为情怀,而是因为 Open 与 KG 的确有着内生密切的联系。 关于 KG 的概念 经常会有其它领域的朋友来问:知识图谱和本体有什么区 别?为什么有人叫知识库又有人叫知识图谱?语义网络和 知识图谱是什么关系?数据库和知识库什么区别? KG 和 NLP 是什么关系? 关于 KG ,如果说得直白一些,只是谷歌出于商业目的创造 出的一个新概念,最早只是谷歌搜索引擎的一个辅助功能而 已,更多是一个工程产品概念。叫什么不重要,但任何一个 新概念的产生都不是突然出现的,而是受到了历史上出现的 很多其它相关事物的各种影响。我想首先把这些相关概念按 历史发展脉络做个简单梳理,这包括:知识库与知识表示 Knowledge Base Knowledege Representation )、语义网络 Semantic Network )、本体论( Ontology )、 Semantic Web、 链接数据( Linked Data )等。首先说知识库( KB )和知识表示(KR) 。KB/KR 都是属于人工智能领域的经典概念。刚才 白老师已经谈到很多 KR 的难题, 如模态知识表示。 三元组 只是最简单的 KR 。今天大多数人谈 AI ,大部分时候说的都 是深度学习和机器学习。人们太容易被下棋所吸引。但是了 解 AI 历史的人都知道, AI 不等于机器学习。从 AI 诞生 的第一天起,知识表示和推理就一直是 AI 在符号这个方向的主要分支,但因为困难比较大而没落严重。但请不要轻视 和忽视符号 AI ,即便是 Hinton 也在强调符号逻辑对于实现 强人工智能的重要性。可以打个比方:深度学习能帮助我们 构建聪明的 AI ,提升的是机器的感知和判断能力,如视觉、 听觉、预测分析等;而 KB 则能帮助我们构建更有学识的 AI ,辅助提升机器的认知能力,如语言理解、常识推理、决 策支持等。显然,聪明不等于有学问、感知不等于智能、计 算不等于推理。后面我们还会谈到,实现高级别的人工智能 仍然困难重重,很多关键的问题根本没有解决。 再说语义网络。语义网络( Semantic Network )有时会与 Semantic Web(有时候会被翻译为语义网)混淆起来。语义 网络是 1960 年前后,作为一种知识表示的手段被提出来。 典型的语义网络如 WordNet 和谷歌 KG 有些不一样。 WordNet 刻画的是词与词之间的关系,而谷歌 KG 强调的 是实体和概念之间的关系。像 MIT 的常识知识库 ConceptNet,以及 BabelNet 大百科语义网络等都更加偏重 于词语之间的关系刻画, 主要用于辅助 NLP 自然语言处理。 此外,在 NLP 领域也一直都在研究怎样自动的从文本抽取 和构建语义网络。 再说本体论。 Ontology 实际上是个哲学概念。 在上个世纪 80 年代,人工智能研究人员将这一概念引入到计算机领域用来 研究知识表示。 Tom Gruber 把本体定义为 “概念和关系的形 式化描述”,这方面代表性的学术方向是描述逻辑 ( Decription Logic )。本体相关的语言或技术通常被用来为知识图谱定义 Schema。

文档评论(0)

158****3214 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档