知识图谱前沿技术研讨会.pdfVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识图谱前沿技术研讨会

知识图谱前沿技术研讨会 肖仰华 复旦大学 2015/12/29 复旦大学知识工场 1 人与机器 机器语义理解是机器与人和谐共存的前提! 2015/12/29 2复旦大学知识工场 关联是机器语义理解的核心 知识图谱 ? Google2012年提出知识图谱,应用于搜索 ? 是大数据时代一种典型的大规模知识表示形式, 表达了实体及其之间的各类语义关系,相对于 本体等知识表示模型,有着较高的实体、概念 覆盖率,表达了更为丰富的语义关系 意义1:下一代智能信息处理的关键技术 知识图谱是意图理解、关系解释、用户画像的技术基础; 在智慧搜索、智慧软件、移动安全、智慧商务等领域有着广阔应用前景 意义2:实现机器智脑(语言认知)的关键技术 ?美国脑计划、欧盟(IBM)蓝脑计划、Google全球脑计划、百度大脑计划、 中国脑计划 ?知识图谱为语义理解提供了丰富的背景知识,是探索语言以及概念认 知的数据基础,是机器智脑实现类人智能的核心 2015/12/29 3复旦大学知识工场 4机遇与挑战 新机遇 新挑战 众包技术的成熟使得利用大规模人力资源构建知识图谱成为可能 完成初始积累的在线知识库正迈进爆发式增长周期 知识图谱在搜索之外应用价值日益显现 深度学习使得无监督的知识图谱构建成为可能 体量更巨 大 关系更多 样 质量要求 更苛刻 计算任务 更复杂 2015/12/29 复旦大学知识工场 5知识工场平台 知识图谱云服务平台 ?集中发布、展示各 类知识图谱,以及相 关的应用系统与平台; ?提供丰富的API访问 接口。 2015/12/29 复旦大学知识工场 6知识库1:CN-DBPedia 致力于从中文百科类网站(如百度 百科、互动百科等)中提取结构化 信息,并将其共享。目前已包含千 万级实体、亿级事实。 ?支持用户进行复杂查询, ?并将中文百科类网站数据与互联网 上其他数据源数据进行连接 关键技术 ?基于深度学习的概念识别 ?实体链接 ?属性融合 ?跨语言类别推断 ?链接实体重组 Examples:复旦大学,校长,许宁生 2015/12/29 复旦大学知识工场 7知识库2:Probase Plus 基于微软亚洲研究院大规模分类体 系Probase,通过一系列质量改进技 术构建的大规模实体概念分类体系。 ?包含千万级的实体与概念,以及isA 关系。 ?在概念化、摘要、搜索意图理解、 用户画像等领域发挥重大价值。 关键技术 ?缺失边补全 ?错误边删除 ?isA关系推断 ?多源分类体系融合 ?中文分类体系补全 Examples: Bill Gates isA Billionaire 2015/12/29 复旦大学知识工场 8知识库3:Verb-base 基于概念模式的大规模动词知识库。 通过挖掘动词短语的概念模式,构建 了常见动词的语义表示形式。 ?该知识库涵盖常见2万动词,共计14 万短语。 ?基于概念模式的动词知识库已经在实 体概念化、词汇的语义表示等方面发 挥积极的作用。 关键技术 基于MDL的泛化 Examples: 2015/12/29 复旦大学知识工场 9系统与平台 KBQA:基于知识图谱的自 然语言问答系统 对于RDF的知识图 谱直接进行自然语言回答,能够回答各类事实 性问答。 CalStayNight:大规模分布式 智能防屏蔽互联网爬虫平台 支持上百节点、分布式、防屏蔽、易部署、高可 用、优先级敏感的互联网数据爬取平台。 NLPDL:基于Torch深度定制 的深度学习平台 支持主流深度学习模型与常见自然语言处理任务、 支持各类基于深度学习模型的知识抽取任务 2015/12/29 复旦大学知识工场 2015/12/29 知识 表示 动词 表示 众包 清洗 图谱 构建 实体 链接 图谱 存储 图谱 查询 实体 探索 实体 搜索 概念 学习 基于深度学习的文本处理 表示 应用管理构建 Outline 10复旦大学知识工场 谢谢! 2015/12/29 复旦大学知识工场 11

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档