- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于两种相似度矩阵的专利引文耦合方法识别研究前沿
总第 268期 2016年 第 3期
通讯作者: 高楠, ORCID: 0000-0002-9152-9545, E-mail: 1183621517@。
*本文系中央级公益性科研院所基本科研业务费专项资金项目“未来学”(项目编号:XK2015-2)的研究成果之一。
XIANDAI TUSHU QINGBAO JISHU 33
基于两种相似度矩阵的专利引文耦合方法
识别研究前沿*
——以脑机接口为例
高 楠 傅俊英 赵蕴华
(中国科学技术信息研究所 北京 100038)
摘要: 【目的】探索基于两种相似度矩阵的专利引文耦合分析方法以识别研究前沿。【方法】基于原始观测值和
余弦距离两种相似度算法, 建立专利相似度矩阵, 利用社会网络分析得到研究前沿簇, 并进行簇类命名, 从而得
到研究前沿。并利用 Innography数据库的脑机接口领域专利对以上方法进行案例研究。【结果】发现两种相似度
矩阵中, 基于原始观测值算法得到 6个研究前沿簇, 涉及 6类 BCI研究内容; 基于余弦距离算法得到 9个研究前
沿簇, 涉及 8类 BCI研究内容, 两者的 FID重合率均为 43%。【局限】本文侧重于两种算法的结果, 即研究前沿
数量、重合度和内容进行比较, 缺少对于算法本身特性的比较。【结论】基于这两种相似度算法的引文耦合法均
可识别出领域的研究前沿, 余弦距离相似度算法能识别出更多数量的研究前沿, 且比基于原始观测值相似度算
法的识别结果更全面。
关键词: 研究前沿 专利 耦合分析 脑机接口 相似度算法
分类号: G255.53 R318.6
1 引 言
研究前沿(Research Fronts, RF)最早由 De Solla
Price[1]于 1965 年提出, 即一组高被引文献, 用于描述
领域内的瞬态特征和动态变化, 是对领域已有主题进
行的评价和分析。1974年, Small等[2]首先提出使用共
被引分析来识别活跃领域的研究前沿。而基于耦合分
析识别研究前沿的定义也于 1994 年由 Persson[3]提出,
即对一簇引用共同参考文献形成了耦合关系的相似文
献, 其施引文献构成了研究前沿, 而被引的参考文献
称为研究前沿的知识基础。Persson还结合文献耦合分
析、作者共被引分析和文献共被引分析等方法研究了
1986 年–1990 年 JASIS 中的文章, 分析了情报学领域
的研究前沿及其与知识基础的关系。Glanzel等[4]也提
出耦合分析是识别研究前沿的新的有效方法。之后,
Morris 等[5]将研究前沿进一步描述为一簇趋于引用固
定的、不随时间变化的基础文献, 即文献耦合集, 以获
得一个领域的整体发展趋势、可视化结构和动态变化。
同时, 采用一种创新的研究前沿分析和展现的时间线
方法, 即基于文献耦合聚类, 并引入连续的时间轴,
以展示各个研究前沿的出现增长和减弱消失的时间
点, 进而得到研究前沿的演进变化, 以及潜在新研究
前沿等信息。Yang等[6]利用耦合分析对 1978年–2006
年囊状纤维化症领域进行分析, 得到 20 项研究前沿,
特别是与骨质密度相关的研究前沿。张婷[7]利用耦合
分析识别了科学传播领域的研究前沿。另外, 有学者
结合耦合分析和其他分析方法对研究前沿进行识别。
如 Jarneving[8]结合耦合分析和完全连接聚类分析识别
了严重呼吸道症候群领域的研究前沿。Chen等[9]利用
专利耦合分析结合自然语言处理技术对美国和全球在
34 现代图书情报技术
研究论文
智能电网行业的研究前沿进行比较。因此, 在文献计
量学领域, 研究前沿既可以通过论文数据的识别表征
科学基础前沿, 也可以通过专利数据的识别表征创新
技术前沿。
研究表明, 文献耦合方法具有较好的时效性, 因
为论文发表后即可获得参考文献数据, 而不需要其被
引用数据, 故最近发表的文献也能被聚成一类[10], 能
够比较快速地反映领域研究前沿的进展变化。但其也
不可避免地存在所有基于引用关系的文献计量方法的
限制: 如引用行为的偏好, 引用内容不同侧重点不同,
不同领域的文献被人为聚在一起, 分析样本的代表性
问题, 忽视部分重要的文献, 以及数据库的问题等[11]。
目前文献计量学领域对于研究前沿的识别分析,
多以论文作为数据源, 较少涉及专利数据的分析。世
界知识产权组织公布的一组数据显示[12], 专利说明书
中含有 90%-95%的研发成果, 其中 85%以上的技术将
不再出现于其他技术文献中, 且要比其
文档评论(0)