面向在线学习知识地图模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向在线学习知识地图模型

面向在线学习知识地图模型   摘 要:知识地图作为一种可视化的在线学习平台,现在被越来越多的学者和企业所研究和应用。本文提出了面向在线学习的知识地图构建方法,利用文本挖掘技术从文件有关特定主题中使用TF/ IDF算法进行关键词提取。同时本文论述了知识地图模型的构建过程,主要包括,关键词提取,关联关系提纲,关联标记。为验证方法的可靠性,本文设计了相关实验,并对模型的效果进行了评价。   关键词:知识地图;在线学习;关联关系   当人们学习文字材料时,他们通常会按照设定的章节顺序来阅读①。虽然这是最常用的基于文本的学习方法,但在以下三种情况下可能会失效。首先,在许多情况下,人们有不同领域先验知识水平②。然而,当他们学习文字材料,如果他们只能从开始到??结束进行阅读,或使用表中的内容直接跳转到一个专门的章节③。第二,在学习者有时间压力的情况下,可以使用目录或索引的表,以确定的主要部分。不过也没有其他特殊的方式来区分重要信息④。第三,如果一个文件是复杂的,或很长的,那么读者可能会发现很难识别重要概念和它们之间的关系⑤。   那么,知识地图的提出在这种情况下可能是很有帮助的,从而可提高在线学习的效率⑥。关键概念和之间关系很直接的呈现在知识地图上,使用户能够很轻易的查询到所需知识。但是,知识地图的构建往往需要领域专家手工操作。本文提出了一种面向在线学习的知识地图自动构建方法并进行了实验验证。   一、面向在线学习的知识地图模型结构   1.模型介绍   知识地图包含的主要元素是节点和关联⑦。节点是领域里一个特定的关键词(或者称为概念),关联就是两个关键词之间的关系。知识地图往往有知识库支撑,知识库通常是许多领域文档的集合。如图一关于约翰?F?肯尼迪的一个知识地图。该地图有18个关键词和30的关联。关键词之间的连接具有不同的厚度,代表不同重要程度的关联关系。关联关系越重要,连接的厚度越大;关联关系越疏远,连接的厚度越小。   知识地图能提供一个在线学习的环境。用户可以可视化的了解围绕约翰?F?肯尼迪的所有概念的全貌,能清晰的判断各类概念与之的关系。如果用户对约翰?F?肯尼迪周围的概念感兴趣,可以直接点击知识地图上的该节点,会出现一个新的页面展示该节点的详情。   2.模型的构建   在本节中,描述了知识地图模型的构建过程,其包括三个步骤,分别是关键词抽取,关联抽取,关联标记。   ⑴关键字提取   在第一阶段中,从一组文档中提取关键词。文档可以手动选择或选择从用户的查询记录中获取。根据一定的算法计算关键词的权重。关键词从知识地图用户的领域主题词列表中选取。在运用关键词权重算法之前,文档中各句子里的连接词与停止词,如“与”和“的”,需要首先被剔除掉。接着,我们可以获取剔除后的仅保留主题词的句子。通过对这些句子运用关键词加权算法,统计其词频,判断其重要性和代表性。这里我们基于词频/逆文档频率(TF/ IDF)方法⑧。下面TF/ IDF权重法的公式:   [Wik=tfiklogNnkk-1t(tfik)2logNnk2]   Wik :术语K在文档I中权重   tfik:术语K在文档I中出现的频率   N:文件的总数   nk:包含术语K的文档总数   加权处理后,每个术语具有其自身的权重。一个关键词在不同的文档中可以有不同的权重,每个文档使用的TF/ IDF算法对主题词进行加权计算。如果相同的关键词出现在多个文档中,它的权重是由其所有权重中的最大值决定。   WMT=Max (WDiT)   Di:i个文件,i=0,1,2……在知识地图中文件的总数   WT:T术语在知识地图中的权重   WDiT:在Di中术语T的权重   关键词是按权重排名之后,根据用户的设置,我们选取一定数量的关键词用于构造知识地图。   ⑵关联关系提取   一旦决定了的知识地图的关键字,第二步就是定义关联关系。在本文中,主要考虑两个因素,其中一个因素是两个主题词出现在相同句子中的频率,另一个是这两个关键词在一个句子中发挥多大的作用。关键词在句中的权重随着句子拥有词语的增多而降低,反之亦然。关键词在句中的关联得分计算公式如下:   [Ri,j=DmSn2NDmSn]   i, j= 关键词对   Ri,j=关键词i和关键词j的关联关系得分   M=1,2,. 在一个知识地图中文档的总数   N=1,2,. 在文档Dm中句子的总数   Sn =有n个句子   Dm=有m个文档   [NDmSn] =在m个文档,n个句子中所有关键词的个数   ⑶关联标记   知识地图中的连接线条越粗,代表关联越强。如果用户选择粗的关联进行点击,系统页面上会同时展现许多句子,会造成信息干扰。因此,建议通过关联标记和分类进一步降低的句子数。   二、实验   1.方法   通过招募志愿者参与知

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档