- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
可视化同被引分析技术综述.doc
可视化同被引分析技术综述
可视化同被引分析步骤主要包括选择数据 源、确定分析的元素、计算同被引频次、对数据进行 标准化处理、对数据进行降维和图示、对图形进行分 析解释。这些步骤中的关键技术在于对获得的高维引
文关系数据进行降维和图示,目前应用较多的主要有 聚类分析、多维尺度分析、因子分析、自组织映射神 经技术、寻径网络技术、最小生成树法、三角测量、 力矢量布局算法等。其中寻径网络技术以其较好的图 示效果得到较多的应用。
关键词同被引分析可视化技术
分类号G354.2
随着信息可视化技术的发展,文献计量学中的引 文分析越来越多地借鉴信息可视化的技术,以形象、 直观的图形方式显现分析结果,使得结论更加具有说 服力。在各种引文分析方法中,利用信息可视化技术 最多的应属同被引分析。最近几年,通过可视化同被 引分析生成学科知识图在国外得到了蓬勃的发展,并 被应用于科学结构的图示、知识领域的显现、学科前 沿预测等方面。本文将对可视化同被引分析中涉及的 一些关键技术进行分析和介绍,希望能够对我国可视 化同被引分析的研究与应用起到抛砖引玉的作用。
1同被引的概念
同被引(co —citation)的概念是由美国人Henry Small在1973年提出的,他最初是以文献为单位进行 分析的,即如果两篇论文a和b被一篇后来的文献C 同时引用,则a与b之间的关系称为同被引关系。同 时引用a和b的文献越多,则a和b之间的关系越近, 内容上的相似度越大。继HenrySmall之后,1981年美 国人Howard D.White把同被引的概念扩展到著者,进 行了著者同被引分析。之后,学者们把同被引分析扩 展到了学科、 甚至类目等,形成了文献同被引分 析、著者同被引分析、学科同被引分析、 同被引 分析、类目同被引分析等。虽然分析对象不同,但这 些不同类型的同被引分析有一个共同原理,就是同时 引用两个单元的文献越多,则这两个单元之间的同被 引强度越大,两者的关系越紧密。
2可视化同被引的步骤和关键技术分析
可视化同被引分析的步骤,包含以下几个过程:
根据要进行的研究选择合适的数据源,抽取数据;
选定要分析的元素对象,例如 、论文、著者、 类目等;③计算元素对象之间的同被引频次,构造原 始同被引频次矩阵;④确定合适的相似度算法对原始 同被引频次矩阵进行标准化处理;⑤用一定的算法把 多维数据在二维或三维空间中聚合并图示出来;⑥对 图形进行分析和解释。
考虑到操作和应用的便利,目前的一些可视化软 件常常把上述步骤中的④和⑤集成到一起供用户选择 使用。由于可视化同被引分析是一个比较复杂的过程, 以上每个步骤涉及到的技术也有很大差异,下面对这 些关键技术进行简要的对比分析。
2.1数据源的选择
进行同被引分析首先需要计算数据元素之间的同 被引次数,这一般要依托某一引文数据库的相关统计 数据来进行,但是元素之间的同被引次数的多寡有可 能随所选择引文数据库的不同而有所区别。以我国中 国科学院推出的《中国科学引文数据库》和清华同方 推出的《中国引文数据库》为例:2007年3月,以同 样的数据获取方式计算我国水稻研究专家袁隆平和程 式华的同被引次数,在《中国科学引文数据库》中, 两者的同被引次数为2;而在《中国引文数据库中》, 两者的同被引次数则是6。造成这一差别的原因是两 个数据库的 收录范围大小不一样,前者只收录核 心刊,后者收录范围则比较广。因此,作为同被引分 析数据源的引文数据库的选择十分重要,既要保证最 后计算所得的同被引次数不能过低,也要兼顾数据库 所选择 的标准,因为引文数据库 收录范围如 果过于庞杂,容易使论文被引用作为影响力的测度标 准失去公正性,被高水平的学术 引用一次和被一 般推广性科普杂志引用一次显然是不等价的。国外学 者做同被引分析一般选用《美国科学引文数据库》(简 称SCI)作为数据源。而国内目前可用的具有引文检索 功能的数据库较多,这就需根据将要分析的专业学科 范围以及同被引次数获得的难易程度来选择。国内的 几个数据库中能够直接检索获得同被引频次的有清华 同方的《中国学术 全文数据库》和重庆维普公司 的《中国科技 数据库》,对于其他几个引文数据库, 则必须根据下载的引文数据,利用一定的程序进行计 算,才能得到同被引频次。
2.2分析元素对象的确立
这里的元素对象既可以是 ,也可以是成篇的 文献,或者是著者,或者是类0,甚至是学科类别。 数据元素不同,所得到的学科知识图反映的内容和作 用也有所不同。
用 或类目或学科类别作为分析元素时,往往 能够图示出科学的宏观结构,可以显示出比较大的主 要学科专业之间的相对位置和关系,但有时也被用于 对某一学科内各专业分支之间关系的图示分析。例如,
Kevin W Boackv、LoetLeydesdorff、J
您可能关注的文档
- 南水北调新乡段水工混凝土施工技术.doc
- 南海中学八年级上册语文第一次月考试题及答案 .doc
- 南海区中小学教学事故处理办法指导意见(试行) .doc
- 南澳县海岛旅游业营销策略研究.doc
- 南澳县海洋捕捞业安全生产问题的思考.doc
- 南瑞集团宁夏电力一体化MS系统技术方案.doc
- 南美白对虾养殖技术 .doc
- 南航住宅楼大体积混凝土施工方案1.doc
- 南通市中考满分作文无棱镜全站仪测量技术在长岐灌区断面测量中的应用 .doc
- 南通市新一轮高新技术产业 .doc
- 2025北京航空工业集团综合所高层次人才及博士招聘20人笔试参考题库附答案.docx
- 2025安徽亳州市利辛县巡察信息中心遴选5人备考题库附答案.docx
- 2025宁波鄞州区东柳街道编外招聘1人备考题库附答案.docx
- 2025云南楚雄市机关事业单位选调63人备考题库附答案.docx
- 2025北京中国社会科学调查中心招聘劳动合同制人员1人备考题库附答案.docx
- 2025宁波市市场监督管理局局属事业单位宁波市标准化研究院招聘高层次人才1人备考题库附答案.docx
- 2025河南郑州铁路职业技术学院招聘合同制工作人员48人笔试历年题库附答案解析.docx
- 2025云南玉溪市红塔区文化和旅游局招聘办公辅助人员1人备考题库附答案.docx
- 2025山东日照市岚山区卫生健康系统事业单位招聘20人备考题库附答案.docx
- 2025四川九州电子科技股份有限公司招聘车载电子事业部-PQE岗笔试参考题库附答案.docx
原创力文档


文档评论(0)