- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多模态知识图谱
作者 :郑秋硕,漆桂林,王萌
知识图谱技术已经被⼴泛⽤于处理结 化数据 (采⽤本体+D2R技术)和⽂本数据 (采⽤⽂本信息抽取技术),但是还有⼀类⾮结 化数
据,即视觉数据,则相对关注度较低,⽽且相缺乏有效的技术⼿段来从这些数据中提取结 化知识。最近⼏年,虽然有⼀些多模态视觉技术
提出,这些技术主要还是为了提升图像分类、图像⽣成、图像问答的效果,不能很好地⽀撑多模态知识图谱的 建。视觉数据库通常是图像
或视频数据的丰富来源,并提供关于知识图谱中实体的充分视觉信息。显然,如果可以在在更⼤范围内进⾏链接预测和实体对齐,进⽽进⾏
实体关系抽取,可以使现有的模型在综合考虑⽂本和视觉特征时获得更好的性能,这也是我们研究多模态知识图谱 (multi-modal
knowledge graph)的意义所在。
⽬前,已经有很多开放知识图谱 (见和),⽽且不少企业也有 ⾃⼰的企业知识图谱。然⽽,这些知识图谱很少有可视化的数据资源。图1所
⽰为多模态知识图谱的发展过程。
图1.多模态知识图谱的发展过程
多模态知识图谱与传统知识图谱的主要区别是,传统知识图谱主要集中研究⽂本和数据库的实体和关系,⽽多模态知识图谱则在传统知识图
谱的基础上, 建了多种模态 (例如视觉模态)下的实体,以及多种模态实体间的多模态语义关系。例如在最新的⼀个多模态百科图谱
Richpedia中 (如下图2所⽰)[5] ,⾸先 建了图像模态伦敦眼图像与⽂本模态知识图谱实体 (DBpedia实体 :London eye)之间的多模
态语义关系 (rpo:imageof),之后还 建了图像模态实体伦敦眼与图像模态实体⼤本钟之间的多模态语义关系 (rpo:nextTo)。
图2.Richpedia中的多模态实体与多模态语义关系
⼀、多模态知识图谱相关⼯作
随着⼈⼯智能技术的不断发展,知识图谱作为⼈⼯智能领域的知识⽀柱,以其强⼤的知识表⽰和推理能⼒受到学术界和产业界的⼴泛关注。
近年来,知识图谱在语义搜索、问答、知识管理等领域得到了⼴泛的应⽤。其中在描述多媒体的可⽤数据集中,现有的⼯作重点是捕获多媒
体⽂件的⾼级元数据(如作者、创建 ⽇期、⽂件⼤⼩、清晰度、持续时间),⽽不是多媒体内容本⾝的⾳频或视觉特性。以下会介绍⼏个重要
的开源多模态知识图谱 :
1.DBpedia[1]
DBpedia作为近⼗年来语义⽹研究的中⼼领域,其丰富的语义信息也将会成为今后多模态知识图谱的链接端点,其完整的本体结 对于 建
多模态知识图谱提供了很⼤的便利。DBpedia项 ⽬是⼀个社区项 ⽬,旨在从维基百科中提取结 化信息,并使其可在⽹络上访问。DBpedia
知识库 ⽬前描述了超过260万个实体。对于每个实体,DBpedia定义了⼀个唯⼀的全局标识符,可以将其解引⽤为⽹络上⼀个RDF描述的实
体。DBpedia提供了30种⼈类可读的语⾔版本,与其他资源形成关系。在过去的⼏年⾥,越来越多的数据发布者开始建⽴数据集链接到
DBpedia资源,使DBpedia成为⼀个新的数据web互联中⼼。⽬前,围绕DBpedia的互联⽹数据源⽹络提供了约47亿条信息,涵盖地理信
息、⼈、公司、电影、⾳乐、基因、药物、图书、科技出版社等领域。
2.Wikidata[2]
Wikidata中也存在⼤量的多模态资源,Wikidata是维基媒体基⾦会(WMF)联合策划的⼀个知识图谱,是维基媒体数据管理策略的核⼼项
⽬。充分利⽤Wikidata的资源,主要挑战之⼀是提供可靠并且强⼤的数据共享查询服务,维基媒体基⾦会选择使⽤语义技术。活动的
SPARQL端点、常规的RDF转储和链接的数据api是 ⽬前Wikidata的核⼼技术,Wikidata的⽬标是通过创造维基百科全球管理数据的新⽅法
来克服数据不⼀致性。Wikidata的主要成就包括:Wikidata提供了⼀个可由所有⼈共享的免费协作知识库;Wikidata已经成为维基媒体最活跃
的项 ⽬之⼀;越来越多的⽹站在浏览页⾯时都从Wikidata获取内容,以增加⼤数据的可见性和实⽤性。
3.IMGpedia[3]
IMGpedia是⼀个⼤型的链接数据集,它从Wikimedia Commons数据集中的图像中收集⼤量的可视化信息。它 建并⽣成了1500万个视
觉内容描述符,图像之间有4.5亿个视觉相似关系,此外,在IMGpedia中单个图像与DBpedia之
您可能关注的文档
最近下载
- 法律职业资格(主观题)历年真题摘选附带答案2024.docx VIP
- 用于皮秒脉冲产生的级联阶跃二极管电路.pdf VIP
- 课外古诗词诵读《梁甫行》课件(共24张ppt)2025-2026学年统编版语文八年级上册.pptx VIP
- 2023高考诗歌鉴赏专项练习:表达技巧4-写景手法(典例引领+方法技巧+巩固训练+答案解析).docx VIP
- 纪念九一八主题班会课件学习资料.ppt VIP
- 佛山市教育局1.pdf VIP
- 基于场效应管与阶跃恢复二极管的皮秒级脉冲源设计.PDF
- 2025法律职业资格(主观题)历年真题摘选附带答案.docx VIP
- 贵阳机场通行证考试试题及答案.doc VIP
- 学校类物业管理投标文件技术部分完整规范模板.doc VIP
文档评论(0)