- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能与图书馆特色资源建设-中国知网
人工智能与图书馆特色资源建设
同方知网 (北京)技术有限公司
师庆辉
人工智能 (Deep Learning )
围棋 艺术 恶性肿瘤检出率 驾驶
60连胜 复活大师的精髓 50% 向上 自动转向与泊车
人工神经网络
神经元 脑功能图谱 分层处理的脑
人脑中的神经元数量约
1011个,每个神经元与其
他1000多个神经元相连接。
请输入文字内容,请输入文字; 请输入文字内容,请输入文字; 请输入文字内容,请输入文字;
人工神经网络
• 大规模的标注数据 (新的石油)
• 高性能的计算能力 (GPU、T PU、类脑计算机...)
• 模型的构建与训练 (模仿人脑)
• 7月8 日国务院发布关于印发新一代人工智能发展规划的通知
图书馆与人工智能
• “再议图书馆发展的十个热门话题” 《新一代人工智能发展规划》的第三条”重点
吴建中 《中国图书馆学报》,2017,43(4) 任务“中专栏二“建立新一代人工智能关键共
性技术体系”提出:
• 图书馆与社会发展
• 识字与素养 知识计算引擎与知识服务技术。重点突破
• 空间再造 知识加工、深度搜索和可视交互核心技术,
实现对知识持续增量的自动获取,具备概念
• 人工智能
识别、实体发现、属性预测、知识演化建模
• 数字人文 和关系挖掘能力,形成涵盖数十亿实体规模
• 开放运动、 的多源、多学科和多数据类型的跨媒体知识
• 公共数字文化与精准扶贫 图谱。
• 图书馆改革
• 第三代图书馆
• “一带一路”与图书馆国际化
图书馆与人工智能 (一体两面)
• 图书馆需要人工智能技术实现服务升级
• 我国人工智能规划在一些行业的落地应用也需要图书馆的数据做
为支撑
• 图书馆特色资源建设是上述两者的基础
人工智能与图书馆特色资源建设
• 数字化是基础
• 版面理解、多语种超大规模字符集识别、图表、公式识
别,多媒体内容识别
• 知识化是关键
• 语义分析、知识标引、领域知识图谱构建
• 服务落地是目的
• 借阅书籍--提供公共的知识服务系统
知网的实践 (数字化)
知网的实践 (数字化)
• 基于深度学习的版面理解与文字识别技术,大大降低加工成本
• 常见中文字符OCR识别:96%提高到99.5%
• 超大规模GBK字符 (繁简混合)识别:80%提高到98%
• 公式图表的自动化识别:90%提高到97% 。
知网的实践 (数字化)
• 文献碎片化的敏捷加工模式是指高度自动化的快捷可迭代加工方法。用户根据自身特
点决定产品的碎片化粒度,可以先期进行粗粒度加工快速发行产品,培育市场;然后
不断在已有基础上进行细粒度迭代加工,每一次迭代形成新的产品形态。
知网实践 (知识化)
• 基于形式的碎片化加工是指将传统的图书等出版物按版式结构或显式内容主题进行标注,建立相关的
知识素材库。基本特点为:
• 可见即可得,不需要复杂的内容分析。
按主题的粒度大小 (碎片化
文档评论(0)