- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
范文范例 学习指导
word完美整理版
HYPERLINK /%e9%a2%86%e5%9f%9f%e5%ba%94%e7%94%a8-%e7%9f%a5%e8%af%86%e5%9b%be%e8%b0%b1%e7%9a%84%e6%8a%80%e6%9c%af%e4%b8%8e%e5%ba%94%e7%94%a8/ 领域应用 | 知识图谱的技术与应用
?
本文转载自公众号:贪心科技。
领域应用 | 知识图谱的技术与应用
李文哲 开放知识图谱 1周前
本文转载自公众号:贪心科技。
?
作者 | 李文哲,人工智能、知识图谱领域专家
导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。 对于读者,我们不要求有任何AI相关的背景知识。
目录:
概论
什么是知识图谱
知识图谱的表示
知识抽取
知识图谱的存储
金融知识图谱的搭建
定义具体的业务问题
数据收集 预处理
知识图谱的设计
把数据存入知识图谱
上层应用的开发
知识图谱在其他行业中的应用
实践上的几点建议
结语
1. 概论
随着移动互联网的发展,万物互联成为了可能,这种互联所产生的数据也在爆发式地增长,而且这些数据恰好可以作为分析关系的有效原料。如果说以往的智能分析专注在每一个个体上,在移动互联网时代则除了个体,这种个体之间的关系也必然成为我们需要深入分析的很重要一部分。 在一项任务中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。
2. 什么是知识图谱?
知识图谱是由Google公司在2012年提出来的一个新的概念。从学术的角度,我们可以对知识图谱给一个这样的定义:“知识图谱本质上是语义网络(Semantic Network)的知识库”。但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。
那什么叫多关系图呢? 学过数据结构的都应该知道什么是图(Graph)。图是由节点(Vertex)和边(Edge)来构成,但这些图通常只包含一种类型的节点和边。但相反,多关系图一般包含多种类型的节点和多种类型的边。比如左下图表示一个经典的图结构,右边的图则表示多关系图,因为图里包含了多种类型的节点和边。这些类型由不同的颜色来标记。
在知识图谱里,我们通常用“实体(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”。实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。
现实世界中的很多场景非常适合用知识图谱来表达。 比如一个社交网络图谱里,我们既可以有“人”的实体,也可以包含“公司”实体。人和人之间的关系可以是“朋友”,也可以是“同事”关系。人和公司之间的关系可以是“现任职”或者“曾任职”的关系。 类似的,一个风控知识图谱可以包含“电话”、“公司”的实体,电话和电话之间的关系可以是“通话”关系,而且每个公司它也会有固定的电话。
3. 知识图谱的表示
知识图谱应用的前提是已经构建好了知识图谱,也可以把它认为是一个知识库。这也是为什么它可以用来回答一些搜索相关问题的原因,比如在Google搜索引擎里输入“Who is the wife of Bill Gates?”,我们直接可以得到答案-“Melinda Gates”。这是因为我们在系统层面上已经创建好了一个包含“Bill Gates”和“Melinda Gates”的实体以及他俩之间关系的知识库。所以,当我们执行搜索的时候,就可以通过关键词提取(”Bill Gates”, “Melinda Gates”, “wife”)以及知识库上的匹配可以直接获得最终的答案。这种搜索方式跟传统的搜索引擎是不一样的,一个传统的搜索引擎它返回的是网页、而不是最终的答案,所以就多了一层用户自己筛选并过滤信息的过程。
在现实世界中,实体和关系也会拥有各自的属性,比如人可以有“姓名”和“年龄”。当一个知识图谱拥有属性时,我们可以用属性图(Property Graph)来表示。下面的图表示一个简单的属性图。李明和李飞是父子关系,并且李明拥有一个138开头的电话号,这个电话号开通时间是2018年,其中2018年就可以作为关系的属性。类似的,李明本人
您可能关注的文档
- 初赛模拟试卷二.doc
- 初中英语易错题精选(配详细讲解).doc
- 传染病知识培训教材.doc
- 大风天气施工设计的方案.doc
- 代理采购供应链服务协议_三方(2012版).doc
- 带式输送机毕业设计论文论文正文.doc
- 德育六化工作的总结上.doc
- 第二节《医院隔离技术设计规范方案》练习试题.doc
- 第二章恒定电流第5_7节.doc
- 电力电子技术考试重点试题及答案解析.doc
- 2024华电电力科学研究院限公司招聘4人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024四川巴中市通江县力迅城乡发展投资集团限公司招聘工作人员及专业技术人员13人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024南方电网调峰调频发电限公司校园招聘【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2022-2023年教师资格之小学教育学教育心理学考前冲刺模拟题库包括详细解答.docx
- 2024南方电网云南国际限责任公司校园招聘2人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024吉林省国资本运营限责任公司出资企业人员招聘2人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024四川事业单位应急应变历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024四川凉山州普格县农业投资开发限责任公司招聘项目建设部工作人员1人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024四川宜宾市屏山县医疗保障局招考编外临聘人员1人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024吉林长春东煤高技术股份限公司招聘技术岗位2人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
最近下载
- EPC项目-市政道路延长线勘察设计施工(EPC)总承包项目-技术标(承包人实施方案、技术方案、管理组织方案).docx
- “双师型”师资队伍建设策略研究课题中期研究报告.doc
- 护士延续注册申请表_5.doc
- 贵金属行业研究:深度复盘:实际降息前黄金股相对收益最高.pdf VIP
- 职工职业技能竞赛—建筑信息模型(BIM)试题题.pdf VIP
- 宁波镇海蛟川书院小升初入学考试卷(含参考答案).doc
- 信访事项说服调解笔录.doc VIP
- (苏教版)小学数学五年级下册暑假作业设计.doc
- 第五课 在和睦家庭中成长(课件)2024年高考政治一轮复习(选择性必修2).pptx
- 江苏省常州市2023-2024学年高一上学期期末学业水平监测数学试卷(解析版).docx VIP
文档评论(0)