- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
陈华钧 OpenKG :愿景与挑战
本文改编整理自浙江大学计算机科学与技术学院教授陈华钧在杭州首届金融知识图谱论坛上的报告。
关于论坛首先作为承办方之一,也代表浙江大学,欢迎各位的到来。特别感谢白硕老师和所有的嘉宾百忙之中抽空过来支持这次论坛。
刚才桂林教授已经介绍过,我们组织这类论坛的一个主要目的是促进跨领域的交流,让知识图谱能更多地在垂直领域落
地。传统的 KG 仍然局限于搜索引擎和 Bot 问答,并以百科类常识类知识图谱为主。 但我们相信 KG 会逐渐渗透到更多的垂直领域。金融则是十分有希望也备受关注的垂直领域之一。
另外这次论坛,我和鲍捷还有一个目的是希望宣传“开放”
对于 KG 发展的重要性。丁力和鲍捷都是语义网和 KG 领域十分资深的专家, 现在也都在创业。 如果讲 KG 怎么构建,我们经常会去争论是该以 Top-Down 的方式去设计构建, 还是该以 Bottom-Up 的方式从粗糙数据中去总结和抽取。我相信他们俩可以争论三天三夜。但有一件事情,特别是做语
义网出身的朋友, 我们不太会去争论, 就是“开放” 对于 KG
发展的重要性。实际上每一个真正深入到 KG 这个领域的
人,都会或早或迟地意识到开放对于 KG 发展的价值和意
义。
我的报告也因此分为三个部分:先谈谈 KG ,再谈谈 Open,
最后谈 OpenKG 。我会从 KG 的发展历程、内涵概念、构
建方法等多个角度,并通过一些事实来引证说明我们发起
OpenKG 这个项目不是因为情怀,而是因为 Open 与 KG
的确有着内生密切的联系。
关于 KG 的概念
经常会有其它领域的朋友来问:知识图谱和本体有什么区
别?为什么有人叫知识库又有人叫知识图谱?语义网络和
知识图谱是什么关系?数据库和知识库什么区别? KG 和
NLP 是什么关系?
关于 KG ,如果说得直白一些,只是谷歌出于商业目的创造
出的一个新概念,最早只是谷歌搜索引擎的一个辅助功能而
已,更多是一个工程产品概念。叫什么不重要,但任何一个
新概念的产生都不是突然出现的,而是受到了历史上出现的
很多其它相关事物的各种影响。我想首先把这些相关概念按
历史发展脉络做个简单梳理,这包括:知识库与知识表示
Knowledge Base Knowledege Representation )、语义网络
Semantic Network )、本体论( Ontology )、 Semantic Web、
链接数据( Linked Data )等。首先说知识库( KB )和知识表示(KR) 。KB/KR 都是属于人工智能领域的经典概念。刚才
白老师已经谈到很多 KR 的难题, 如模态知识表示。 三元组
只是最简单的 KR 。今天大多数人谈 AI ,大部分时候说的都
是深度学习和机器学习。人们太容易被下棋所吸引。但是了
解 AI 历史的人都知道, AI 不等于机器学习。从 AI 诞生
的第一天起,知识表示和推理就一直是 AI 在符号这个方向的主要分支,但因为困难比较大而没落严重。但请不要轻视
和忽视符号 AI ,即便是 Hinton 也在强调符号逻辑对于实现
强人工智能的重要性。可以打个比方:深度学习能帮助我们
构建聪明的 AI ,提升的是机器的感知和判断能力,如视觉、
听觉、预测分析等;而 KB 则能帮助我们构建更有学识的
AI ,辅助提升机器的认知能力,如语言理解、常识推理、决
策支持等。显然,聪明不等于有学问、感知不等于智能、计
算不等于推理。后面我们还会谈到,实现高级别的人工智能
仍然困难重重,很多关键的问题根本没有解决。
再说语义网络。语义网络( Semantic Network )有时会与
Semantic Web(有时候会被翻译为语义网)混淆起来。语义
网络是 1960 年前后,作为一种知识表示的手段被提出来。
典型的语义网络如 WordNet 和谷歌 KG 有些不一样。
WordNet 刻画的是词与词之间的关系,而谷歌 KG 强调的
是实体和概念之间的关系。像 MIT 的常识知识库
ConceptNet,以及 BabelNet 大百科语义网络等都更加偏重
于词语之间的关系刻画, 主要用于辅助 NLP 自然语言处理。
此外,在 NLP 领域也一直都在研究怎样自动的从文本抽取
和构建语义网络。
再说本体论。 Ontology 实际上是个哲学概念。 在上个世纪 80
年代,人工智能研究人员将这一概念引入到计算机领域用来
研究知识表示。 Tom Gruber 把本体定义为 “概念和关系的形
式化描述”,这方面代表性的学术方向是描述逻辑 ( Decription
Logic )。本体相关的语言或技术通常被用来为知识图谱定义
Schema。
您可能关注的文档
- 选文科还是理科的条件.docx
- 通信设备维修实习报告范文3000字.docx
- 通知书评语初中.docx
- 造型奇特令人震惊的酒店设计.docx
- 遇见你,爱上你,已耗尽我全部的幸运.docx
- 道德模范个人先进事迹材料汇编.docx
- 邮储银行网点一线员工自我提升心得体会.docx
- 郑晓鸿开营活动方案.docx
- 部编本新人教版一年级语文上册第七单元课教案以及教学反思.docx
- 部编版一年级下册教学设计.docx
- 陕旅版五年级英语上册教案集体备课2.docx
- 陕旅版小学四年级上册英语全册教案.docx
- 陕西省咸阳市2014届高三下学期第二次模拟考试化学试题含答案.docx
- 陕西省咸阳市2018_2019学年高一历史下学期期末考试试题(含解析).docx
- 陕西省咸阳市实验中学2018_2019学年高二化学上学期期中仿真卷(A卷).docx
- 陕西省商洛市2018_2019学年高一地理下学期期末教学质量检测试题201909060269.docx
- 陕西省师大附中2011-2012学年高二下学期期末试题地理.docx
- 陕西省西工大附中2012届高三第四次适应性训练题政治.docx
- 陕西省西工大附中2013届高三上学期第一次适应性训练数学理试题含答案.docx
- 除尘器布袋应用技术要求最终版.docx
原创力文档


文档评论(0)