- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
这是人工智能应用工程师(高级)的考试大纲,我想按大纲开始学习,今天学习(七)知识图谱,按照大纲,给我出一份学习材料。要求材料丰富,详细,严格按大纲的大标题,小标题出具。内容要尽量通俗易懂,遇到复杂难懂的知识,尽量在知识后面给出举例子,案例,说人话,通俗易懂的一种解释说明。最后有关键知识的练习题和解析。再最后额外加入扩展知识学习内容。
知识图谱
一、知识图谱概述
(一)知识图谱的概念
定义:知识图谱是一种用“节点+边”表示知识的网络结构,节点代表实体(如人、物、概念),边代表实体间的关系。
例子:以“姚明”为节点,边可以是“职业→篮球运动员”“国籍→中国”,形成关于姚明的知识网络。
核心作用:将零散信息结构化,便于机器理解和推理(如搜索引擎通过知识图谱直接回答“姚明多高”,而非返回网页列表)。
(二)知识图谱的架构
逻辑架构:
数据层:存储具体的三元组(实体-关系-实体),如(华为,总部位于,深圳);
模式层:定义实体类型和关系类型,如“公司”是实体类型,“总部位于”是关系类型。
技术架构:
知识提取→知识表示→知识融合→知识存储→知识推理→应用接口。
(三)开放知识图谱的概念和特点
定义:公开免费的知识图谱,允许大众查询和贡献数据。
典型案例:
Freebase:谷歌维护的百科知识图谱(已整合到GoogleKnowledgeGraph);
Wikidata:维基媒体的多语言知识图谱,任何人可编辑(如维基百科词条关联的结构化数据)。
特点:开源、多领域、数据量大,但可能存在准确性问题(需人工校验)。
(四)知识图谱在行业数据分析中的作用
案例1:金融风控
构建企业知识图谱,关联“企业-法人-股东-贷款记录”,识别关联担保风险(如某法人同时担任多家高负债企业的股东)。
案例2:电商推荐
通过商品知识图谱(如“手机→品牌→苹果,型号→iPhone15,参数→屏幕尺寸6.1英寸”),推荐配件(“购买iPhone15的用户常买无线充电器”)。
二、知识图谱构建的关键技术
(一)知识提取的概念和应用方法
定义:从非结构化数据(文本、图像)中提取实体和关系。
方法举例:
实体提取:从新闻“马斯克宣布特斯拉2025年推出新款电动车”中提取实体“马斯克”“特斯拉”“2025年”;
工具:百度LAC(LexicalAnalysisofChinese)可批量提取中文实体。
(二)语义提取的概念和应用方法
定义:理解文本的深层含义,而非字面意思。
案例:
句子“苹果价格上涨”可能指水果“苹果”或公司“苹果”,通过上下文语义提取确定对象(如后续提到“iPhone16”则指向苹果公司)。
(三)属性和属性值提取的概念和应用方法
定义:提取实体的特征信息。
例子:
实体“华为Mate60”的属性提取:
属性“处理器”→属性值“麒麟9000s”;
属性“发布时间”→属性值“2023年9月”。
(四)关系抽取的概念和应用方法
定义:识别实体间的关联关系。
自动抽取案例:
从“周杰伦是昆凌的丈夫”中抽取关系:(周杰伦,配偶,昆凌);
从“北京是中国的首都”中抽取关系:(北京,首都,中国)。
(五)知识表示的概念和应用方法
定义:用结构化方式存储知识,最常用“三元组”表示。
三元组示例:
(爱因斯坦,职业,物理学家);
(《蒙娜丽莎》,作者,达?芬奇)。
扩展表示:
带时间维度的三元组:(北京,举办奥运会,2008年),表示事件的时间属性。
三、知识图谱融合
(一)知识图谱融合的概念和特点
定义:合并不同来源的知识图谱,消除重复和矛盾数据。
例子:
来源A:(张三,年龄,30);来源B:(张三,年龄,32)→融合时需验证真实年龄,可能通过身份证信息确认正确值。
(二)知识图谱中的异构分类
类型1:模式异构
不同图谱的实体类型定义不同:
图谱A将“手机”归为“电子产品”,图谱B归为“通讯工具”。
类型2:数据异构
同一实体的表示不同:
图谱A用“iPhone15”,图谱B用“苹果手机iPhone15”。
(三)本体概念层的融合方法与技术
定义:融合实体类型和关系类型的定义。
方法:
人工匹配:专家手动对齐“电商图谱”中的“商品”和“物流图谱”中的“货物”为同一概念;
算法匹配:用余弦相似度计算概念向量的相似度(如“电脑”和“计算机”的向量相似度高,判定为同一概念)。
(四)实例层的融合与匹配方法
定义:融合具体实体的实例数据。
案例:
融合两个公司图谱中的“腾讯”实体:
对比属性:注册资本、成立时间、总部地址;
若大部分属性一致,判定为同一实体,合并数据。
您可能关注的文档
最近下载
- 《现代汉语语法研究——层次分析法》PPT课件.pptx VIP
- 2022年厦门大学计算机科学与技术专业《操作系统》科目期末试卷B(有答案).pdf VIP
- 跨越国界的正义追寻:腐败犯罪所得跨境追回的国际法律剖析.docx VIP
- 水电站安全标准化全套资料—安全管理制度汇编.pdf VIP
- 2026-2030女鞋市场发展分析及行业投资战略研究报告.docx
- CFD软件:CFX二次开发_(11).边界条件的自定义开发.docx VIP
- 《工程项目管理》期末考试试卷(有答案).pdf VIP
- T∕NAHIEM 111-2024 生物、医疗行业传递窗技术规范.pdf VIP
- 2023年厦门大学计算机科学与技术专业《操作系统》科目期末试卷A(有答案).docx VIP
- 《现代汉语(下册语法部分)》PPT课件.ppt VIP
原创力文档


文档评论(0)