- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
石油勘探开发知识图谱
和智能问答探索
大纲
一、知识图谱及历史背景
二、勘探开发知识图谱背景及技术成果三、勘探开发知识图谱---技术方案
知识图谱及查询
智能问答
简单问答
复杂问答
四、 前研究工作
一、知识图谱及其历史背景
历史背景
前状态
为什么会有知识图谱?
知识表示
知识
表示
逻辑和推理规则
Frame, Semantic Network, Ontology, Representation Logic,…
精确、结论可回溯
泛化能力差,适用于小数据
? 统计学习
知识图谱
? 依赖数据分布模型
? 黑盒
统计
? 泛化能力强,适用于大数据
量
学
习
? 知识图谱
据
,NLP
数
? 知识与知识、知识与数据之间的联系
? 将知识表示与统计学习进行关联
? 知识表示方法进行精确地知识与知识联系的初步构建;
? 统计学习方法,构建大量的知识与数据之间的联系,补充知识之间的联系。
知识图谱-语义搜索
Google知识图谱-语义搜索,关联性搜索
知识图谱-辅助问答交互
知识图谱-辅助大数据分析
知识图谱-语义辅助设备互联
设备抽象与语义互操作
知识图谱-应用领域
二、勘探开发知识图谱
背景
勘探开发过程中产生的数据、图像、理论、成果及经验总结多以文档存储;
隐性的
当前人工智能发展以大数据为基础;
显性的
信息与智能鸿沟
信息多但无数据(结构化标注数据)
知识多但无联系
成果多但无重用
知识?
人工智能?
大数据?
勘信探息开与发智知能识鸿图沟谱
二、勘探开发知识图谱---技术成果
知识图谱构建
勘探开发知识表征
图数据库
图搜索
勘探开发文档智能分析
文档结构分析
章节识别
段落识别
图像识别
引文识别…
文档语义分析
实体词识别
关系抽取
主题分析
词嵌入,图嵌入…
大数据
人工智能
? 智能问答
勘探
油藏 开发
…
分析
分析 分析
? 简单问答
? 问题语义分析
关系
勘探开发
? 查询语句生成
知识图谱
数据
? 图语义匹配和搜索
表格
图像
文档
? 结果排序
数据
格式
数据
? 复杂问题
勘探开发文
? 语句段落语义分析
档智能分析
语句语义索引
深度语义匹配模型
辅助决策
智能
问答
非关系
数据
知识
关系
二、勘探开发知识图谱-技术成果
知识及其图谱数据
文档来源
知识图谱及关系数据
一期
?
油气时运移论文466篇
? 概念实例13826及5357关系
?
海相碳酸盐文章20 篇
? 实例三元组19468
二期
?
石油汉语主题词表
? 概念词10277及其关系71963
?
油气资源论文2509篇
? 实例三元组898700(89万条)
?
中国石油勘探开发百科全书
? 实例三元组139656(14万条)
辅助文档
?
Wikipedia
概念实例(1600万)及6212关系
复杂问题语义匹配训练数据 实例三元组1016967016(10亿)
通用问答对138516;专业问答对 2000
石油概念词图谱
非正式主题词
一级学科 (ID)
包含
等价
包含
正式主题词
label
次级学科
中英文
(ID)
族首 上位词ID 下位词ID 相关词ID
实体词汇:10277
词组关系:56985
学科包含关系:14978
石油概念词图谱
正式主题词—→ 滨岸相
英文名—→ Shoreside facies
D无障壁海岸相
←—非正式主题
词
F 近滨亚相
直接下位类
非正式主题词—
无障壁海岸相
→
英文名—→ No barrier coast
phase
Y 滨岸相
←—正式主题词
非正式主题词
海岸砂丘亚相
……
S 陆相
←—直接上位类
Z 相*
←—族首词
C 沉积相
←—相关词
正式主题词
学科范畴—→
1100 石油、天然气
学科子类—→
地质与勘探
1102 油、气、水物
词族索引
理、化学性质
←—主题词
低硫原油
低密度原油
←—非正式主
Y 轻质原油
题词
←—正式主题
词
相*
←—族首词
? 测井相
? 沉积相
下属主题词
范畴索引
? ? 沉积微相
……
二、勘探开发知识图谱---技术成果
关键算法指标
关系抽取算法-CSSEM
测试数据
算法名称
准确率 召回率
F1
GSA
DSNF
83.42
56.10
67.09
(通用领域)
CSSEM
84.37
68.94
75.88
OSA
DSNF
43.52
38.24
40.71
(勘探领域) CSSEM
76.85
57.12
65.53
简单问答匹配算法-DERM
准确率
SEQA
0.4040
DERM
0.5509
TempalteQA
0.62
WebQuestion 数据测试集
复杂问答匹配算
文档评论(0)