构建以专利为核心的科技大数据平台以促进创新的设想.docVIP

构建以专利为核心的科技大数据平台以促进创新的设想.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
构建以专利为核心的科技大数据平台以促进创新的设想.doc

构建以专利为核心的科技大数据平台以促进创新的设想   摘 要:随着我国知识产权行业的发展,专利申请量不断创出新高。2015年中国发明专利申请量突破100万件,同比增长18.7%,连续5年位居世界首位。我国已经积累了海量的专利数据,同时也积累了大量的非专利数据、应用数据、检索数据等,并且建立了相应的检索系统和分析系统。本文分析了以专利为核心的科技文献大数据的现状,提出了基于大数据关联与整合思路和基于专利信息服务产业链整合思路的两个创新应用观点,并从“五个一”的建设内容、六大关键技术等方面阐述了以专利为核心的科技文献大数据信息服务平台的构建设想,最后从产业整合、信息服务、成果转化、价值评估、数据挖掘等5个方面强调了大数据服务平台对促进创新的作用。   关键词:专利;大数据;科技文献;信息服务;创新   中图分类号:C931 文献标识码:A   作为具有国家知识产权局背景的专利信息服务行业领导者之一,知识产权出版社多年来积累了大量的国内外专利文献数据和非专利科技文献数据。2014年~2016年,我们的数据收集范围从专利扩大到商标、标准、科技期刊、知识产权和创新类图书等,专利信息也从单纯的文摘和全文扩展到法律状态、审查文件、流程信息、运营信息、复审和无效决定、知识产权司法判例等,数据量从1亿扩大到近5亿,数据量达500TB。如此巨大的数据量必须得到有效应用才能产生巨大的价值,推进我国技术创新和科技发展。现在有很多专利信息服务商能够提供传统的专利检索和分析服务,但是都仅限于专利,而且数据质量参差不齐,不够全面、准确和权威,服务价格相对较高。如果能以知识产权出版社的大数据为基础,进行整合加工处理,并进行大数据关联,构建一个以专利为核心的科技大数据信息服务平台,向终端用户提供质优、价低、权威的“一站式”信息服务,以及在此基础上的专利大数据管理、运营、交易等扩展服务,则可以更好地促进我国的知识产权和科技创新工作。   一、专利与科技文献大数据现状及创新应用分析   (一)现状分析   以专利为核心的相关科技文献数据有较大规模。根据我们当前所积累的与专利相关的科技文献数据,总体分为专利文献数据、非专利科技文献数据(二者合称为核心资源数据)、检索数据、应用数据、平台数据和管理数据。具体包括:   1. 核心资源数据   主要分为专利数据(含审查过程数据)、商标数据、标准数据、法律文书数据、期刊数据、其他数据。主要内容如下:   (1)中国专利全文文本数据;   (2)国外专利全文文本数据(包括美国、欧洲、日本、韩国、世界知识产权组织WIPO、英国、德国、法国、瑞士、奥地利、加拿大、澳大利亚等);   (3)国外专利著录项目数据(共包括100余个国家及地区、组织);   (4)中外专利法律状态数据;   (5)中外专利引证文献数据;   (6)中外专利生物序列数据;   (7)中外专利化学结构数据;   (8)中外期刊元数据数据库;   (9)中外标准数据;   (10)中国知识产权类法律文书数据;   (11)知识产权法律法规数据;   (12)中国商标数据;   (13)美国商标数据;   (14)马德里国际商标数据;   (15)知识库及词表数据库;   (16)中外专利说明书及附图全文图像数据。   2. 检索数据   主要包括为实现检索而收集整合的原始数据和加工数据,特别是各个检索字段。   3. 应用数据   应用数据包括专利检索数据和非专利检索数据(主要是检索表达式和检索结果)、专利分析数据、项目管理数据、大数据商城数据、客户服务数据。   4. 平台数据   平台数据包括系统和网站的资源目录、表单、文本、图片、视频和网页。   5. 管理数据   系统管理数据包括用户数据、权限数据、日志数据、统计发布数据、监控数据、运维数据。   根据我们当前的检索业务运行情况,数据检索日访问量在10万左右,数据记录与分析记录量在10亿,在线服务数据量在150TB左右。   (二)基于大数据关联与整合思路的创新应用分析   根据与专利相关的科技文献大数据内容分析,专利文献与非专利文献表现出很强的相关性,例如专利与科技文献间引证关联关系、检索内容关联关系、文献信息相似性关系等,需要用大数据关联的思想对其进行分析、挖掘和整合,将相关数据整合后对外展示和提供服务,产生一系列新的价值。   以专利为核心的科技文献大数据关联与整合的主要过程包括:   1. 对专利和非专利文献进行收集、整理、存储。   2. 对数据进行清洗、整合、深加工、翻译、代码化等处理。处理完成的数据经过大数据分析,采用数据挖掘算法、预测性分析、语义引擎等技术进行智能关联,将文献引证关系、技术关联性、新

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档