- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
定义:对于语言序列??1,??2,…,????,语言模型就是计算序列的概率,即??(??1,??2,…,????)。语言模型是对语句的概率分布的建模。通俗解释:判断一个语言序列是否是正常语句P(我/是/中国人)P(中国人/我/是)分类:统计语言模型(N-gram)神经语言模型(Word2vec、Glove)预训练语言模型(ELMo、Transfomer、BERT、……)*语言模型company神经网络模型:词嵌入“Youshallknowawordbytheitkeeps”J.R.Firth(1957)基本思想:用上下文预测某个词语言是高度抽象的离散符号系统,而wordembeddings把离散的符号变成向量。word2vec,2013,Google*知识图谱构建技术*知识图谱构建技术信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。? 实体抽取,也称为命名实体识别(namedentityrecognition,NER),是指从文本数据集中自动识别出命名实体。关系抽取:文本语料经过实体抽取之后,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关语料中提取出实体之间的关联关系,通过关系将实体联系起来,才能够形成网状的知识结构。属性抽取:属性抽取的目标是从不同信息源中采集特定实体的属性信息,如针对某个公众人物,可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。命名实体识别(NamedEntityRecognition,简称NER),指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。需要识别实体指称的边界和类别。于中国石油勘探开发研究院位北京市。位置关系勘探开发研究院北京市位于*任何图都会有三个重要元素构成:顶点边属性知识图谱是基于图的数据结构图作为一种广泛应用的数据结构,其优势主要表现在两点:一是顺藤摸瓜,给定一个节点,顺着其边的信息,能够快速的找到它的邻居节点。换言之,在图里面查询信息很容易。二是拉帮结派,由于图的传播性强(邻居的邻居也跟自己关系紧密),相互之间联系紧密的节点可以构成一个子图(或子团)。*图数据库源起欧拉和图理论(graphtheory),也可称为面向/基于图的数据库,对应的英文是GraphDatabase。图数据库的基本含义是以“图”这种数据结构存储和查询数据。它的数据模型主要是以节点和关系(边)来体现,也可处理键值对。它的优点是快速解决复杂的关系问题。图存储技术OWLVocabularyDataowl:Classowl:ObjectPropertyowl:DatatypePropertyrdfs:Literal:储层:流体:地质特征rdfs:subClassOfrdfs:subClassOfrdfs:subClassOfrdfs:subClassOfrdfs:subClassOf:孔隙度rdfs:Domainrdfs:Domainrdfs:Domainxsd:doublerdf:typerdfs:rangerdfs:domainrdf:typerdf:type:原始油气比:地层原油粘度rdfs:Domainrdfs:Domainrdfs:Range复杂断块高孔中渗储层稀油孔隙度:26%渗透率:127×10-3um2含油饱和度:37%~62%原始油气比28.7m3/t地层原油粘度:0.5mPa.svs:subClassOfvs:subClassOfvs:hasSaturationvs:porosityvs:permeabilityvs:saturationvs:gasoilratiovs:viscosityrdf:type:渗透率rdf:typerdf:type:含油饱和度:hasSaturation产量数据表测井数据*图存储技术知识应用技术*知识搜索根据用户的输入,返回相对应的实体和属性举例:港2井坐标返回:港2井的x坐标158,y坐标113知识推荐根据输入的一个或者多个实体,返回相关的实体列表举例:地球物理测井返回:测井方法,饱和度,孔隙度知识搜索/推荐① 提供基于知识图谱的知识搜索/推荐功能,根据用户的搜索语句,利用自然语言处理的能力,理解用户的搜索意图,返回最匹配的知识条目以及相关的推荐内容② 在石油勘探生产、科研过程中,需要检索文献或其
原创力文档


文档评论(0)