- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家科学图书馆青年人才领域前沿项目
研究报告
项 目 名 称 数据挖掘技术在专利信息分析中的应用研究
项 目 负 责 人 张勐 电 话 028办)
所 在 部 门 国家科学图书馆成都分馆情报研究部
Email: zhangm@
中国科学院国家科学图书馆制
2010年6月
目录
1、前言 3
1.1课题研究的背景及意义 3
1.2 国内外研究现状 3
1.3 本项目的研究内容 5
2、专利数据预测的应用研究 6
2.1指数平滑模型 6
2.2自回归模型 8
2.3自回归移动平均模型 9
2.4时间序列预测结果分析 11
3、技术主题关键词的词频分析 13
4、专利文本分类的应用研究 19
5、总结及展望 20
参考文献 21
1、前言
1.1课题研究的背景及意义
专利信息是目前世界上最大的技术信息集,每年有超过一百万件的专利被公开。世界各国的最新技术有95%是最先在专利文献中公开。运用数据挖掘技术分析与预测专利信息就是希望从海量数据中发现数据存在的关系和规则,根据现有的专利信息预测未来的发展趋势。
运用数据挖掘技术对现有专利信息进行分析,可以了解技术发展的生命周期或所处阶段、专利数据的主要来源或竞争对手的分布,以减少重复研究和无效劳动。本项目以有机发光显示器(OLED)专利数据为例,运用时间序列分析方法对未来的专利申请量进行预测,以了解该领域技术产出未来可能的发展状况;对专利申请题名的关键词进行频次分析,探索关键词与技术发展方向的映射关系,分析该领域技术发展的重点领域;利用KNN文本分类模型实现对专利文档的自动分类。
1.2 国内外研究现状
随着科学技术的迅速发展,传统专利信息分析方法,也由过去的原文分析法、简单统计分析,发展到了借助于人工智能、神经网络等技术的专利可视化分析方法。深入的挖掘专利文献群中隐含的规律,为技术创新管理提供了可靠的情报保障和决策依据。
目前,国外许多公司开发了众多专利分析工具专利分析工具分析提供准确的数据,从不同层面对专利文献进行科学的分析以及分析结果的可视化显示。美国Thomson Reuters公司推出的数据挖掘和可视化分析工具Thomson Data Analyzer。TDA除支持德温特世界专利索引、Web of Science和Pubmed等常用数据库外,还支持MS Excel数据的导入。TDA软件提供强大的数据清洗功能保证了数据分析的准确性,在分析功能方面支持基本统计、共现分析、聚类分析,但不支持专利引文分析功能,结果显示方面可自动生成列表、矩阵、聚类图、报告等功能。Aureka则是美国Thomson Reuters公司开发的一个在线的知识产权管理和分析平台,提供强大的专利检索、管理、分析包括专利引证分析,专利地图分析等预警等功能。在专利分析方面,通过ThemeScape提供聚类分析生成专利地图,通过Aureka Citation Tree提供引文分析生成引证树,揭示专利信息间的相互关联,为用户技术研发与自主创新、专利评价与评估、专利权保护、企业联营与合作或兼并等的生产经营决策活动提供帮助。Aureka软件在数据清洗方面功能较弱是该软件的主要不足。
STN AnaVist、Delphion等。STN AnaVist是美国化学协会 ACS)分支机构化学文摘服务社CAS)与 FIZ Karlsruhe共同开发的一款科技文献、专利文献文本分析可视化软件。支持化学文摘、德温特世界专利索引、欧洲专利数据库和美国全文专利数据库等多个数据库的内容。此外,STN AnaVist可利用CAS词表对机构、技术术语进行数据规范以提高数据分析的质量。文献分析结果显示可生图表,以及采用聚类技术生成的研究景观图。Delphion是美国Thomson Reuters公司开发的专利信息服务平台,集成Snapshot、Corporate Tree、PatentLab-II、Text Clustering、Citation Link五个工具,分别提供在线分析、公司名称规范、列表和直方图等图表生成、文档聚类、引文分析功能。Delphion专利信息平台收录专利范围广、整合分析工具多是其主要特色,但其按服务项目、专利下载数量收费的服务模式,使得一般用户难以承受其高昂的费用。目前在专利分析应用较多的主要是Thomson Data Analyzer和Aureka。
在专利信息分析工
您可能关注的文档
最近下载
- 钢柱、钢梁、钢结构制作安装.pdf VIP
- xx售楼中心、样板间、会所物业服务方案.doc VIP
- 2025年贵州贵阳乌当富民村镇银行招聘客户经理笔试历年典型考题及考点剖析附带答案详解.docx
- 2025年初级钳工试题及答案钳工试题(含答案).docx VIP
- 一张奖状的动力(1).doc
- 框架钢结构施工组织设计.pdf VIP
- 2025年交管学法减分考试题库以及答案(160题完整版) .pdf VIP
- 学校食堂食材配送服务方案(肉类、粮油米面、蔬菜水果类).docx VIP
- 2025年交管学法减分考试题库以及答案(160题完整版) .pdf VIP
- 会计师事务所质量管理制度.docx VIP
文档评论(0)