- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用信息智能体挖掘WIKI中数字图书馆社群的方法
任 辉 申 晋 周晓光
(鲁东大学 山东烟台 264025)
摘 要:人们对数字图书馆的研究,大都集中在技术方面。以人为本的后数字图书馆时代,人的因素、如行为、内容和社团的协同作用更加重要。数字图书馆社群的行为研究逐渐成为信息行为研究领域的核心问题。本文利用信息智能体的方法研究数字图书馆Wiki网络用户的浏览行为,该方法能挖掘出数字图书馆有意义的Wiki社群,目的是优化数字图书馆站点和为数字图书馆用户提供个性化服务。
关键词:信息智能体;Wiki;数字图书馆;社群
中图分类号:TP303 文献标识码:A
1、关于Wiki
Wiki原本意思是quick,是一种超文本系统。wiki就是一个互动开放的网站,所有人都可以对网站内容进行编辑、扩展、更正。这是一种借助互联网共同创建、积累、完善和分享知识的全新模式。开放性、共享性和协作性是wiki的主要特性。它的共享特性,实现了快速广泛的信息整合,为大量社群的知识共享提供了高效的平台。在一个wiki里,任何信息都可以被社群修改和删除。在众多社群的参与下,这种自由的操作方式能避免一些外在因素对知识内容带来的影响,从而反映更为客观和真实的知识内容。与Blog强调个人的自主性相比,Wiki更强调知识社区内集体的协作。它更适合数字图书馆用户协同创作,如共同构建知识数据库等。
近年来,参与wiki的人数不断增多,许多专业人士参与到wiki队伍中,有数字图书馆用户、图书馆工作人员、信息管理专家以及信息技术顾问和科研工作者。许多高校由图书馆学科馆员和课题组成员共同组成的利用wiki进行课题研究共创网络的平台正在蓬勃兴起。Wiki中的数字图书馆社群以研究课题为主题,不仅提供了信息流通的渠道,同时也累积了这些信息中所蕴含的知识,wiki创造了一种开放式的研究氛围。这方面,上海中医药大学的徐平教授和他的学生们创建的“针灸研究和教学”(/grass/wiki)在我国率先选用wiki方式,师生们一起进行国家的课题的研究和共创,取得了良好的效果。Web上有大量wiki社群,发现这些数字图书馆隐含社群具有重要意义,对那些对数字图书馆某个专题感兴趣的人来说,发现与此相关的社群可以提供有价值、最可靠、最及时的信息。 同时,识别这些wiki社群可以使数字图书馆的服务定位更加准确。
2.前期工作——日志挖掘
在利用信息智能体建立模式之前,首先要通过Web服务器日志获取wiki用户访问记录。wiki用户的主要数据源来自于Web服务器所产生的日志文件集。这些日志文件包含了访问Web站点的一些重要的数据源。服务器日志文件包括服务器日志(Server logs)、错误日志(error logs)、曲奇日志(coodie logs)。另外,服务器端的用户注册信息是能提交给服务器相关的信息,Coodie能够在用户端存储用户访问服务器的信息,用户注册信息和coodie日志是服务器端用户日志的很好补充。日志记录了网页被使用的信息,如IP 地址、访问时间、哪一页、字节大小等。通过服务器的数据挖掘可以实现智能分析,得到隐藏的大量繁杂数据。
Web日志挖掘主要分为三个步骤来实现:第一步为数据预处理,根据挖掘的目的,对原始Web日志文件中的数据进行提取、分解、合并,最后转化为适合进行数据挖掘的数据格式,并保存到关系型数据库表或数据仓库中,等待进一步处理。数据预处理环节是整个过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着非常重要的作用。第二步为模式识别,运用各种算法对处理后的数据进行挖掘,生成模式。第三步为模式分析,通过对用户访问模式的分析,从而将有价值的模式提取出来的过程。
3 智能体网络用户浏览模型
在没有人的干预下,能够自主地完成给定任务的对象都可以称为智能体。它具有一定的知识、目标和能力,即具有必要的领域知识、通讯知识和控制知识。又具有必要的推理、决策能力。从最终用户角度来看,它是用户实现其意图的软件助手,能独立或几乎不需要指导地代表用户完成指定的任务。智能体具有自主性、学习性、社会性、反应性、友好性等特性。本实验是关于网络wiki用户浏览模式的研究。首先,智能体通过自己的目标、职责、活动、行为规则、思维、服务、资源需求等属性完整地描述将要承担的系统角色。其次,信息寻觅智能体在具有信息的网络空间中漫游,根据智能体的浏览结果可以得出wiki网络用户的浏览模式,并且进行分析、研究,得出wiki用户的兴趣分布与网络信息分布和网络结构之间的关系。
3.1 兴趣分布模型
在模型中,信息智能体代表用户,具有自己的兴趣、行为准则、行动策略。在信息寻觅智能体模型中将反映wiki用户的浏览兴趣属性、兴趣分布模型、决
文档评论(0)