网站大量收购独家精品文档,联系QQ:2885784924

基于标签关键词的用户行为分析..pdfVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于标签关键词的用户行为分析..pdf

情报杂志 Vd.29No.3 第22091舞0霸期年3月 OFINTELLIGENCE Mar. 2010 JOURNAL 基于标签一关键词的用户行为分析* and ofUsers7Behavior Tag Keyword—BasedAnalysis 潘 婵 冯利飞 丁婉莹 贺 芳 (武汉大学信息管理学院武汉430072) 摘要标签和关键词是用户对网络资源的两种标引方式,随着互联网的发展和信息资源的大面积共享趋势,标签 词已经成为web2.O的重要元素。通过对不同领域问标签与关键词的相似度的分析入手,来分析领域问标签与关 键词相似度的差异。进一步来探讨差异存在的原因和影响因素,从而揭示了网络用户的行为特点。 关键词标签关键词Web2.0用户行为 中圈分类号G25 文献标识码A 好地反映用户行为。 1概述 2研究流程 随着Web2.O的发展与普及,用户已经广泛地参 与到数字资源的组织和描述活动中,用户不仅是资源 2.1 数据准备 的创造者和使用者,还是新一代的资源描述者和组织 us[7J等均为标签网站。在本研究中我们选择了涉及领 者。标签作为Web2.0的核心技术之一,已经受到广 泛关注。 标签是一种准确、灵活、开放的分类方式,是用户 Del.icio.us的中间层,它是由上层用户给出的,是一种 为自己的文章、图片、音频、视频等一系列文件定义的 带有语义的标引。在实验中把用户U用标签t标引网 一个或多个描述…1。 页b的一个组合记为0(u;t;b)。 关于标签,国内外很多专家都做过相应研究。在 2.2数据抽取本实验划分为两组实验进行。在 标签揭示语义方面,已经有研究通过对标签揭示数字 第一组实验中。我们在Del.icio.惜上分别抽取学术领 学术资源内容能力的衡量,得出了标签在揭示资源内 容方面具有重大作用【2J。而在用户行为研究方面, 了保证实验的客观性、科学性,我们在实验过程中确保 Ciro采用统计学和概率论的方法对del.icio.US和Con. 了两个领域的抽取数量一致、抽取时间一致。 note中的标签进行了统计分析,构架了用户使用合作 在第二组实验中,我们选取了学术领域和娱乐领 性标签的随机模型。研究得出尽管用户个体的认知过 程、个体分类以及标记行为是复杂的,但是在合作性标 签系统内,用户的标记行为却遵循着简单的活动模 标引,并针对每个Bookmark给出5个标签。 式[3|。Scott采用模型和图表研究了用户使用合作性2.3数据清洗为了保证本实验得到的数据确实 标签系统的规律及相关标签使用的稳定性等的分析, 属于学术和娱乐两个领域,且不存在参杂其他主题的 认为标签反映了用户兴趣的发展变化HJ。 数据,我们对每个O(u;t;bi)都进行了点击链接确认。 但是,现阶段对于网络环境下,用户对不同领域资 另外,为了使抽取出的关键词尽可能表达出网页主题, 我们剔除了Bookmark中含有过多超链接、图片等多媒 源的标引特征研究较少。本文意在探讨Web2.0环境 下用户的标引特征,揭示网络标引的内在规律,从而更 体的网页,仅留下那些纯文本的网页。 收稿日期:2009—10—27 修回日期:2009—12—2l 基金项目:国家大学生创新实验项目“web2.0环境下信息自组织。(编号:081048603J。 向为Web2.O、信息检索;贺芳(1988一)。女,本科。研究方向为Web2.0。 万方数据 ·140·

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档