- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文献计量的我国搜索引擎研究现状和热点分析
基于文献计量的我国搜索引擎研究现状和热点分析
摘要:运用文献计量的方法对我国搜索引擎领域的相关文献进行多角度的定量和定性分析,明晰搜索引擎研究领域的主要研究机构、核心作者和核心期刊,并通过论文关链词和主题分析,发现目前的研究热点主要集中于4个方面:(1)搜索引擎的基本原理和关键技术;(2)元、垂直、个性和智能等4种搜索引擎研究;(3)搜索引擎的应用及商业盈利;(4)搜索引擎相关的知识产权等法律问题4个方面。
关键词:搜索引擎;文献计量;研究现状;热点
近年来,由于网络和信息技术的快速发展,互联网上的信息成爆炸式的增长,网络成为了人们发布和获取信息的重要渠道,然而网络信息过于分散和无序的分布使得用户获取信息遇到很大困难。在这种背景下,搜索引擎提供的信息服务方式也越来越重要。搜索引擎是一种用于帮助因特网用户在互联网上查询信息的搜索工具,它以一定的策略在因特网中发现、搜集信息,并对搜集的信息进行加工整理和组织存贮,为用户提供检索服务,从而起到信息导航的作用。搜索引擎产生于20世纪90年代。产生的时间虽不长,但已经在学术界、商业界以及人们的日常生活中发挥了巨大的作用,根据中国互联网信息中心2010年7月发布的《中国互联网络发展状况统计报告》第26次调查统计报告显示搜索引擎用户规模已达3.2亿人在各类网络应用使用率中的排名位居第三,这使得网络搜索引擎的研究成为当前国内外研究的热点。为了解我国近年来在该领域的研究现状、热点以及分析其发展趋势,笔者拟用文献计量的方法对我国搜索引擎领域的相关文献进行以定量分析。希冀得出一些有益的结论,为该领域的研究提供借鉴。 HYPERLINK http://www.hg0088.cd hg0088 HYPERLINK http://www.hg0088.cd http://www.hg0088.cdJ543
1、数据来源和研究思路
1.1 数据来源
采用清华同方的中国知识资源总库(CNKI)中的数据库之一“中国学术期刊网出版总库”作为数据来源,文献发表时间截止到2011年底,检索时间为2012年1月,以“题名”为检索途径,以“搜索引擎”为检索词进行检索,得到检索结果为3814条数据。除去20条为各类研讨会征稿通知,剩余3794条为和搜索引擎相关的文献数据。
1.2 研究思路
本文首先采用文献计量方法对相关文献的数量、著者分布、期刊分布、主要研究机构进行分析以揭示研究现状,然后对数据进行抽样,选取发表时间为近五年即2007-2011年的核心期刊论文,对其所研究的主题内容进行分析从而揭示出该领域的研究热点及发展趋势。主要利用CNKI自带的检索结果分组和Excel进行数据统计。
2、文献调研与分析结果
2.1 文献信息量统计
发表文献的数量在一定程度上代表了某个领域的研究水平与发展趋势。图1所示的是1996-2011年16年间的文献量,其中2011年的数据可能还有部分文献没有上传到网上,估计全部数据应比2010年数据相差不多。从图中可以看出从1996-2004年是搜索引擎相关的论文的迅猛增期,在这个数据库中从1996年才出现的搜索引擎相关文献,到2004.年已经迅猛发展到300多篇,此后发文量进入稳步发展期,从2007年有一个发展高峰,2008-2009年达到顶峰,从2010年略有下降。应该是进入又一稳定发展时期。考查文献内容可知,搜索引擎的发展已经从诞生、迅猛发展、平稳发展,进入专门化深入化研究。这也表明对搜索引擎这一领域研究的逐步成熟。据此可以预见在未来一段时间内,搜索引擎研究仍将是我国学者关注的热点之一。
2.2 论文著者统计分析
对于作者发文量的统计分析可以识别某研究领域的高产作者。本文选取发文量5篇以上的作者作为高产作者,共31人,共发文211篇如表1所示。
对高产作者发文量的统计中发现很多作者是合著者,我们知道第一作者是论文的主要责任人和撰写人,选取以第一作者身份发表论文的作者统计如表2所示。
对论文被引频次的统计可反映其及学术影响力。截止检索日被引次数前十的高被引作者如表3所示。
被引频次排在第一的是来自华东理工大学的陈树年教授,他是我国著名情报检索语言专家,长期从事检索语言的研究、教学和实践工作,在分类法、主题法以及网络信息组织研究领域有较高的造诣。从表2和表3我们也可以看出高产作者和高被引作者基本不一致,这说明虽然近年来对搜索引擎的研究比较热门投入到这一领域的专家也非常多,但专注于此的人并不多。高产并且高影响力的专家还显缺乏。其中只有张卫丰教授是既高产又高被引的作者,他主要从事Web应用技术、模式分类、搜索引擎技术、人工智能、机器学习、数据挖掘以及信息获取等方面的研究,是年轻一代的专家。
2.3 高产机构分析
文档评论(0)