- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键词共现的教育信息化工程发展初探
李烯‘
(南京师范大学教育技术系, 江苏南京210097)
摘要:为了有效挖掘大量教育信息化网络文档中的热点信息,提出了应用关键词共现技术来揭示该
关键词之间的关联与结合,进一步分析比较不同时期的热点关键词来获得近几年教育信息化工程的发展动
态及趋势。系统着重解决了文档关键词的提取及其共现图的建立两大问题,实验结果表明,我国近几年的
教育信息化工程发展主要围绕着信息化、远程教育、CERNET、Ivp6等核心概念,逐步实现了从硬件基础设
施到软硬兼施、从城市到农村,从快速发展到全面健康发展的过程。
关键词:关键词提取:关键词共现:教育信息化工程
一、引言
教育信息化的概念是在20世纪90年代末伴随着信息高速公路的兴建而提出来的,它是
跨世纪教育发展改革的重要~步。然而,最终达成信息化教育这一目的不是朝夕之间能完成
的事情,正如南国农教授强调【l】,教育信息化是一个动态的不断发展的过程,了解这一过程
不仅仅是反映了过去几年教育信息化建设情况,而且能为更好地推进教育信息化工作进程作
出一定提示和反思,为教育事业的推进提供参照。
一般地,一个领域的文档集能集中反应该领域的发展情况,而任何一篇有意义的文档都
有一些关键词来反应文档的主题内容:当在同一篇文档中使用不同的主题关键词时,就意味
着它们之间存在一定相关关系,这种关系是作者认可的,即使这种关系是弱关系,但如果有
足够的不同作者都对同一种关系认可,那么这种关系可以认为在这些作者所关注的领域具有
一定的意义。鉴于此,文章采用关键词共现分析这一技术,以教育信息化类新闻文档为语料,
通过提取出文档的关键词,计算关键词之间的共现频次来揭示该领域关键词之间的关联与结
合,进一步分析比较不同时期关键词的共现情况米获得领域相关方面的发展动态或发展趋
势。
二、相关工作
Haluk
拉I,使用路透社1987年新闻库中的21578篇新闻,构建了基于人物姓名共现的社会网络,
并对该社会网络表现出来的小世界现象、幂次现象等相关属性进行了研究。在教育技术领域,
社会网络研究进一步促进了网络教学及领域研究者的网络互动。特别地,基于某一网络课程
虚拟平台的学习者关系提取与构建不但能改善社会网络结构来提高网络课程学习效果,而且
在网络课程的评价中也发挥着重要作用【3击l。 叶新东等人【71着眼于博客社群的研究,关注教
育技术博客社区的结构,以及博客们所建构个人的社会关系,文章利用社会网络分析法,描
述和测量虚拟社群成员之间的关系以及社群结构特征、群体成员的地位和意见领袖地位的形
成,提高博客、论坛等网络教学平台的教育、教学效果。同时,对于某一领域内研究者合著
研究也是通过共现的原理来构建合著网络来反映研究者社会网络关系互动情况【s’91。
同样地,近几年利用共现分析技术来揭示领域关键词之间网络联系和微观结构的表征的
研究也越来越受到关注。2008年12月在东京的NTCIR-7研讨会上【l…,几位NECCC创
Kawai、KaZHO
新研究实验室的成员Hideki Yamada,通过构建统计词语的
Kunieda与Keiji
共现网络来反映事件的全局动态状况,如出生率、赌博支持率等,他们主要做了两个方面的
工作:一方面通过后缀树的模式匹配来从文本语料中获取统计词语,另一方面建立这些统计
1作者简介:李烯,女,1984年生,硕士研究生,主要研究方向:数据挖掘,信息抽取,
程使用现状自动量化评价系统研究”(课题编号:ECA090441)的研究成果之一。
74
词语的共现关系,并通过可视化的网络拓扑图展现这些关系,进一步从网络结构和统计关键
词间的语义结构两方面来进行图的简化。2008年郑州大学图书馆的副研究馆员周爱民老师
【l¨,采用词频共现的分析法,建立关键词之间的K.核共现矩阵,进一步计算Salton指数来
表示关键词之间的关联强度,最后得到了共现强度聚类图,并分析了共现关键词之间产生距
离远近的原因。同年,中国医学科学院的安新颖、李静【l2】以microRNAs领域发表的文献为
基本数据集,以主题词共现为主要分析方
文档评论(0)