- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘工具在教育技术学文献探究中应用
摘 要 文献研究法在教育研究领域中有着普遍且重要的 意义。在科学研究文献激增的今天,用人工进行文献检索与 处理已经不再现实,将数据挖掘技术引入文献研究领域势在 必行。运用文献分析软件EndNote和RefViz,对近年SCI外 国文献库中教育技术学领域(education technology)的文 献进行分析,试图发现各文献间的相互联系,从中找出该研 究领域的热点问题及发展趋势。
关键词EndNote; RefViz;文献分析;数据挖掘;教育 技术
中图分类号:G40-057文献标识码:A文章编号: 1671-489X (2012) 33-0048-03
随着传统文献转换成数字文献后,文献的数量呈几何数 增长。对于科研人员来讲,要在浩瀚的文献中快速找到所需 的文献资料,并且提取文献中有用的价值信息,相对困难。 同时国内外的一些数据库(如CNKI、SCI等)的检索功能虽 然强大,但是基于关键词匹配的检索算法逻辑性言语的表 达,使其检索的结果不能令人满意(往往会检索到冗余文 献)。因此,利用EndNote和RefViz数据挖掘工具,可以方 便快捷地将检索的文献信息转换成可视化的信息,并且根据 自动分类功能,分析同组环境下文献信息的关联性。此外, 根据Ref Viz中的主题词信息,分析学科领域中的热点信息 及学科发展趋势。因此,基于文献数据挖掘(Data Mining) 技术在任何一个学科领域都具有强大的生命力,对学科的发 展具有深远的意义。
1数据挖掘的概念
数据挖掘(Data Mining)具有关联、聚类、分类、异 常、特异群组和演变分析的功能,与文献研究的目的相同。 数据挖掘是从大量的、不完整的数据中,提取隐含在浩瀚数 据中的具有规律性和潜在价值的信息的过程[1]。
1.1数据挖掘技术对文献研究的作用
减轻研究人员负担,提高研究效率。传统文献研究 需要研究人员阅读大量的文献材料,然后人工进行文献的整 理与分类,同时对所要研究的问题做系统性分析。当文献数 据的量非常大时,传统的文献研究法便有些力不从心,即使 花费大量的人力和时间,也有可能无法完成。将数据挖掘技 术引入文献研究领域,代替人工进行数据检索、筛选、统计、 聚类分析等,可以大大减轻研究人员的负担,提高研究效率。
弥补传统文献研究的不足。文献研究法中既有非结 构式定性分析,又有结构式定量分析,它们从不同的侧面对 文献中所包含的信息进行加工和整理。传统的文献研究法多 为结构式定性分析,使用数据挖掘技术对文献进行定量分析 具有明显性、客观性、系统性等特点,因而可弥补定性研究 缺乏直观性和系统性的不足。
1.2数据挖掘工具的类型
数据挖掘技术用于文献研究主要是对文献进行聚类、预 测、关联和相关性分析等,因此,根据数据挖掘的功能将其 分为共引分析、共著分析、著者分析、共词分析和共篇分析 等[1]。下面简要介绍共词分析和共篇分析。
1) 共词分析。共词分析是一种内容分析方法,通过分 析同一个文本的主体内容,统计对单词或短语出现的频度, 从而确认文本所代表的学科领域中各个研究热点的相互关 系,进而探索学科的发展趋势[1]。共词分析首先从文献数 据库中抽取出现频次超过一定阈值的高频主题词,两两统计 这些主题词在同一篇文章中同时出现的次数,形成共词矩 阵,然后围绕这个共词矩阵进行分析。
2) 共篇分析。共篇分析是指两篇或者两篇以上的文献 具有一个或多个相互联系的关键词,这类关键词连结多篇文 献的纽带,这种纽带的关系可称之为文献关键词链。用途主 要包括:①从内容上了解文献之间的内在联系,了解该领域 在研究方向上的类同和相关联程度;②分别统计具有相同主 题词的文献作者群,能了解该主题研究领域在世界范围内的 分布和发展趋势。
2 EndNote和Refivz工作原理简介
1 EndNote工作原理简介
EndNote是一款功能强大的科技文献管理软件,其友好 的界面风格受到广大科研人员的好评,并得到广泛应用。 EndNote的最新版本提供了 3200多种期刊的参考文献的格 式。此外,其开放的过滤器和期刊样式编辑方式为用户提供 了个性化的选择。
2.2 RefViz工作原理
RefViz 是 Thomson ISI Research Soft 和 OmniViz 公司 共同推出的一款可视化的文本分析工具,能对大量文献数据 进行归类和分析,是典型的共篇分析软件。
RefViz功能非常强大:
1) 该软件能将参考文献库中参考文献的主题内容进行 组织排列,并以直观的图形方式将其呈现在一个可视化的交 互窗口中;
2) 提供在线搜索工具,用户可以随意指定软件内置的 各类数据库,为用户进行跨库检索提供了方便;
3) 能实现与文献管理软件(如EndNoteRefer
文档评论(0)