异构专利数据源集成方案设计与实现.pdfVIP

异构专利数据源集成方案设计与实现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《现代图书情报技术》版权所有,欢迎下载引用! 请注明引用地址:异构专利数据源集成方案设计与实现[J],现代图书情报技术,2010(9):67-73. 总第197期 2010年 第9期 异构专利数据源集成方案设计与实现 翟东升 禾文汇 (北京工业大学经济管理学院 北京 100124) 【摘要】针对目前用于专利分析的数据存在来源单一、预处理操作不够、可挖掘程度浅等问题,设计并实现异构专 利数据源集成方案,即从七国两组织的专利数据库获取数据到本地专利数据库;以本地数据库为基础数据源,利 用SSIS工具通过ETL(数据抽取-数据转换-数据装载)操作,生成规范的、集成的高质量数据;进而将其加载到 事先围绕KPI(关键性能指标)分析构建好的专利数据仓库中,从而为专利多维分析以及数据挖掘提供有效的数 据支持。 【关键词】专利信息 数据集成 数据仓库 ETL 数据清洗 数据转换 【分类号】G250 DesignandImplementationofDataIntegrationoverHeterogeneousPatent Sources ZhaiDongsheng HeWenhui (SchoolofEconomicsandManagement,BeijingUniversityofTechnology,Beijing100124,China) 【Abstract】Withconsiderationoftheproblemsconcerningthedataofpatentanalysis,suchassingledatasource,rough pretreatment,andlow-leveldatamining,thispaperdesignsandachievesthedataintegrationoverheterogeneouspatent sources.Specifically,thelocalpatentdatabasewherethedataareacquiredfromheterogeneoussourcesincludingtwo organizationsandsevencountriesisregardedasbasicdatasource.AfterusingtheSSIStoolfordatacleaninganddata transformation,thedatafromlocaldatabaseareloadedintodatawarehousethatisbuiltaccordingtothekeyperformance indicators,whichprovidesdatasupportformoreadvantagedanalysis. 【Keywords】Patentinformation Dataintegration Datawarehouse ETL Datacleaning Datatransformation 1 引 言   专利作为科技创新成果的重要表现形式和主要载体,蕴含着巨大的知识含量,具有启发性、可靠性、准确性等 特点,因此专利信息已成为不可或缺的竞争情报信息源。目前不少国内外机构致力于专利信息分析研究,更多关 注于如何从海量的专利数据中收集到及时、有效的专利信息,帮助企业了解技术状态、技术地位,识别新的技术领 域、技术机会,进而做出有效决策。   专利分析研究已经取得了一定的成果,但仍存在许多不足。如在理论和方法方面,分析数据来源单一、分析 [1] 前数据处理有待加强、聚类分析的深度和准确性有待完善、分析与分析指标的匹配度不高 ;在分析工具方面,存 [2] 在多种数据源的融合度低、可扩展性差、知识挖掘程度浅等问题 。   收稿日期:2010-06-28   收修改稿日期:2010-08-12    本文系北京市自然科学基金“知识产权预警机制信息服务平台研究”(项目编号:9092002)研究成果之一。  XIANDAITUSHUQINGBAOJISHU    67 情报分析与

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档