面向微博用户的兴趣识别算法的研究与实现-软件工程专业论文.docxVIP

面向微博用户的兴趣识别算法的研究与实现-软件工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生优秀毕业论文 西南交通大学 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1.保密口,在 年解密后适用本授权书; 2.不保密匦/使用本授权书。 (请在以上方框内打“√”) 学位论文作者签 、司庭 燧名:渺 秒t 5。箩,功 日期:加1 3-一奎‘啮 日期: 万方数据 西南交通大学硕士学位论文主要工作(贡献)声明本人在学位论文中所做的主要工作和贡献如下: 西南交通大学硕士学位论文主要工作(贡献)声明 本人在学位论文中所做的主要工作和贡献如下: 1、实现了面向用户的微博爬虫,对指定的微博用户,采集其历史微博内容信息和 关注用户列表,作为用户兴趣识别的数据源。 2、研究融合微博内容和社交关系信息的用户兴趣识别方法。对于微博内容信息, 基于文本和图像的分类技术,分别从文本和图像两个角度研究用户兴趣的识别,然后 研究文本和图像的融合方法;对于微博的社交关系信息,综合考虑用户所关注、转发 和提及的社交行为,挖掘用户所互动的社交关系用户集,通过检索兴趣权威用户库匹 配社交关系用户的兴趣,并依此从社交关系的角度对用户进行兴趣识别。然后研究融 合微博内容信息和社交关系信息的融合。 3、实现了面向微博用户的兴趣识别算法。通过定义兴趣类别,按照本文研究的方 法构建兴趣识别模型。对于给定的用户,获取相关数据源,并用兴趣识别模型得出用 户在各个兴趣类别上的概率值。 最后以实验结果进行标准衡量,证明了研究工作具有一定的研究成果和工程应用 价值。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 万方数据 西南交通大学硕士研究生学位论文 西南交通大学硕士研究生学位论文 第l页 摘 要 随着Web2.0时代的到来,以微博为代表的新兴社交媒体取代了传统媒体的地位, 标志着个人互联网时代的到来。作为一种分享和交流平台,微博更注重时效性和随意 性,个人能在其中每时每刻分享和接收最新的消息和思想。然而,随之而来的是信息 呈爆炸式增长,如何从如此庞杂的数据中识别出用户感兴趣的内容成为近年国内外学 术界的研究热点。本文在分析中文微博的特性的基础上,结合目前主流的研究技术, 并融合用户微博内容信息与社交关系信息对微博用户进行兴趣识别方法的研究。本文 的主要研究及工作内容包括: 1、实现了面向用户的微博爬虫,对指定的微博用户,采集其历史微博内容信息和 关注用户列表,作为用户兴趣识别的数据源。 2、研究融合微博内容和社交关系信息的用户兴趣识别方法。对于微博内容信息, 基于文本和图像的分类技术,分别从文本和图像两个角度研究用户兴趣的识别,然后 研究文本和图像的融合方法;对于微博的社交关系信息,综合考虑用户所关注、转发 和提及的社交行为,挖掘用户所互动的社交关系用户集,通过检索兴趣权威用户库匹 配社交关系用户的兴趣,并依此从社交关系的角度对用户进行兴趣识别。然后研究融 合微博内容信息和社交关系信息的融合。 3、实现了面向微博用户的兴趣识别算法。通过定义兴趣类别,按照本文研究的方 法构建兴趣识别模型。对于给定的用户,获取相关数据源,并用兴趣识别模型得出用 户在各个兴趣类别上的概率值。 最后以实验结果进行标准衡量,证明了研究工作具有一定的研究成果和工程应用 价值。 关键词:兴趣识别;数据挖掘;文本分类;图像分类 万方数据 西南交通大学硕士研究生学位论文 西南交通大学硕士研究生学位论文 第1 l页 Abstract Wim the coming of Web2.0.micro-blog has taken place of the traditional media as the representative of emerging social media,which is the symbol of the internet for individuals. As a kind of sharing and exchange platform,micro-blog pays more attention to tim

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档