《一种基于专利文本的技术系统构成识别方法.》.pdfVIP

《一种基于专利文本的技术系统构成识别方法.》.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《一种基于专利文本的技术系统构成识别方法.》.pdf

目t缯彳蜃工作 第58卷 第 10期 2014年5月 技术部件的变化以及由技术部件组装而成的技术结构 terInstituteofBiotechnology)所提供的WebService接 口 的变化,从专利文本角度来说,具体表现在两个方面: 对每个专利摘要进行术语抽取,最终得到专利一术语 ①不同阶段术语的变化,包括新术语的产生和旧术语 映射 ,通过术语汇总得到术语集合。 的消亡 ;②不同阶段术语在专利文本 中出现频次以及 3.2.2 获取连续时间段术语交集的共现 网络 选择 共现频次的变化。 两个连续时间段,分别汇总其中的专利术语以形成术 然而直接对不同阶段专利的术语进行分析却难以 语集合,对这两个集合求交后,反向投影到这两个时间 识别隐藏其中的技术系统构成 ,其原因在于:①所有术 段的专利 一术语映射关系上,得到过滤后的专利 一术 语并非处于同一水平线上 ,而是存在上下位关系,直接 语映射关系,并基于此形成这两个时间段的术语共现 使用术语共现网络进行聚类 ,同一聚簇内的节点问可 网络。 能存在大量上下位关系,从而难以揭示技术系统构成 3.2.3 获得连续时间段术语交集共现网络的差异矩 的完整结构;②更重要的是 ,技术系统构成中各部件的 阵 通常使用邻接矩阵表示共现网络,在这里对其加 创新活跃程度并不均匀,部分创新活跃区域的突出往 以修正,将术语出现频次作为邻接矩阵对角线元素存 往会掩盖处于非活跃 区域的系统构成部件 ,从而使术 放于矩阵中,从而使相邻时间段邻接矩阵的差值不仅 语共现网络的聚类结果只得到部分技术片段,而无法 反映了术语相互关系的变化情况 ,也反映了术语 自身 得到技术系统构成。 的频次变化情况。 因而,本文所提方法着眼于不同时问段之间技术 3.2.4 使用 同质块建模 (homogeneityblockmodeling) 的改变 (包括新旧技术更替以及技术间关系的增强减 方法,对差异矩阵进行聚类 同质块建模方法是块建 弱),试图对技术变化情况进行聚类,从而识别技术系 模聚类方法的推广,相比原有方法,其在聚类过程中不 统构成,该方法具体流程如图1所示 : 仅考虑网络节点之间的关联关系,同时考虑关联关系 的权重大小。同质块建模方法的聚类思想是 :划分到 获取两个连续时间段中 专利的术语集合 同一块 内的节点集合,其相互之间的关系权重彼此接 近 。同质块建模方法并不要求网络的权重数值必须 筛选出第2时间段较第1 获取两时问段术语的交集, 时间段新增术语 根据专利一术语映射 ,得到 为正 ,所以适合对差异矩阵所表征的网络变化情况进 两个时问段 的术语共现 网络 行聚类。在同质块建模方法的具体实现上,本文使用 R语言扩展包 Blockmodeling所提供 的函数进 行计 使用第2a~问段网络的邻接矩 阵减去第 1时间段 网络的邻接 算 ,以初步抽取技术系统构成 。 矩阵,得到差异矩阵

文档评论(0)

iyjt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档