- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智能研究在知识发现与知识传播领域中的几个新方向
人工智能研究在知识发现与知识传播领域中
的几个新方向
同方知网(北京)技术有限公司
张振海
2017/11/22
提纲
一.神经信息检索
二.神经机器翻译
三.智能问答
四.阅读理解
五.图像文字声音的融合
六.思维导图生成
七.选题分析
八.创新点挖掘
九.引用动机分析
一○.用户画像
(一)神经信息检索:改进了检索的性能
基于深度神经网络的信息检索,更好处理如下问题:
• 词汇问题:同义,近义,未登录词,集外词
• 查询扩展问题
• 跨语言: 中文、英文、俄文、德文、法文、日文等
• 跨媒体: 文本,图像,声音
查全查准率都有提升,神经信息检索可望成为下一代信息检索系
统的核心技术。
(二)神经机器翻译促进学术传播
推动学术媒体全球一体化
• 无论中文向外传播,还是
西文向内传播的速度都明
显加快。
• 中外文互译的质量都有较
大提高。就信达雅的三个
层面而言,目前可以说达
到了基本可信的阶段。
• 学术媒体跨语言传播,全
球一体化的趋势正在形成。
(三)智能问答:在事实类问答方面已超过人类
• 科学研究与技术开发都需要 问答系统具有三种能力:学习、
大量事实类数据支撑。事实 理解、推理,是事实类数据查找
类知识数据自动处理一直是 发现的重要技术途径。
重要的研究方向。
• 例子:
• 2011年,IBM的Watson发布
• 服用阿莫西林有什么副作用?
• 知网的QA • 乙醇对表面活性剂临界胶束浓度的
• 问题类型:5W1H 问题回答 影响
• 回答方式: • 光质对白芷生长发育的影响
• 2012年第一季度中国黄金储备
• 基于检索的问答
• 回流焊设备的传送方式有几种
• 基于知识库的问答
• 基于知识图谱的问答
(四)机器阅读理解
机器扫描文本,理解文本内容,并能基于文本内容回答相关问题
• bAbi: Facebook,1000个问题
• MCTest: MSR,650短篇小说
• CNN/DailyMall:DeepMind 、30万新闻
• CBT : Facebook 、儿童书测试、98本书、60万个问题
• SQuAD : 斯坦福大学、10万个问答对、500多篇文章
• 测试类型:选择题 、完型填空、问答
(五)图像文字声音的融合:从图像识别
到图像语义分割(1)
图像处理能力是我们最为重要的感知能力,我们大部分的信
息都要通过眼睛获得。
计算机已经能够识别复杂图像中的不同的语义对象
图像中的学术不端检测
(五)图像文字声音的融合:相互转换,
统一发现(2)
• 从文字到图像:根据文字描述生成一幅图像;从图像到文字:给一幅图像生
成一段文字描述;从图像到声音:生成背景音乐。
• 可以利用文字检索图像,也可以利用图像检索到文字,声音可以转换为文字,
文字可以转换为声音。
• 为增强出版知识内容提供了很好的发现手段。
/@samim/generating-captions-c31f00e8396e
(六)思维导图自动生成
• 思维导图
是一种将思维形象化的方
法。出版物是思想的成果。
• 文献思维导图
在知识图谱技术的支撑下,
可以为每一篇文章自动生
文档评论(0)