基于兴趣聚类自动建模.docVIP

下载本文档

4
0
约6.79千字
约 15页
2018-08-29 发布于福建
举报
版权申诉

基于兴趣聚类自动建模.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于兴趣聚类自动建模

基于兴趣聚类自动建模　　摘要：针对传统粗兴趣粒度表示的建模方法不能准确描述每个用户的兴趣主题的问题，提出基于兴趣聚类的自动建模方法. 利用文档聚类发现用户的多个子兴趣主题，从而提高对用户兴趣偏好描述的准确性. 将该方法用于个性化信息检索，取得较好的效果. 　　关键词：用户模型；自动建模；兴趣聚类　　中图分类号：TP18 文献标志码：??A 　　　　Automatic modeling based on interest clustering 　　ZHAO Jinghe, LIU Guiquan 　　(Dept. of Computer Sci., Univ. of Sci. Tech. of China, Hefei 230027, China) 　　Abstract： Because the traditional modeling approach of rough interest-granularity can’t describe interest of everyone in detail, the automatic modeling based on interest clustering is proposed. It uses the document clustering to find multi-interests of each user and the accuracy of describing user’s interests is improved. The method is applied in personalization information recommendation and achieves better effect. 　　Key words： user profile; automatic modeling; interest clustering 　　　　0 引言　　　　随着Internet技术的高速发展，网上的信息资源以指数形式增长.相对于巨大、无序的互联网信息空间，每个用户真正感兴趣的信息非常有限，如何从这个信息海洋中准确找到所需要的信息越来越受到人们的关注.现有的搜索引擎如Google，虽然为人们获取信息提供很大方便，但是由于其通用的性质，仍然不能满足不同背景、不同目的和不同时期用户的查询请求.个性化服务技术就是针对该问题而提出的，它通过收集和分析用户信息来学习用户的兴趣和行为，从而为不同的用户采取不同的服务策略、提供不同的服务内容. 　　为了跟踪和学习用户的兴趣行为，有必要为每个用户建立1个模型，有关用户建模技术的研究已经成为个性化服务研究的关键技术.在个性化服务中，目前主要有3种用户建模技术：手工定制建模，由用户自己手工输入或选择的用户建模方法；示例用户建模，由用户提供与自己兴趣相关的示例及其类别属性来建立用户模型的建模方法；自动用户建模，根据用户的浏览内容和浏览行为自动构建用户模型的建模方法.上述3种用户建模技术中，前两种都需要用户参与，对用户的依赖降低了个性化服务系统的易用性；理想的用户建模方法应该无须用户主动提供任何信息，系统根据用户的浏览内容和浏览行为自动构建用户模型. 　　本文提出基于用户兴趣聚类的自动建模方式，根据用户浏览的内容进行兴趣聚类，从中可以得到用户的多个子兴趣主题，从而提高对用户兴趣、偏好描述的准确性. 　　　　1 相关研究　　　　作为个性化服务的基础和核心，用户兴趣模型的质量直接关系到个性化服务的质量.只有当用户的兴趣、偏好和访问模式等用户信息很好地被系统“理解”时，才能实现理想的个性化服务. 　　近年来，有关用户建模技术的研究开始从具体的个性化服务形式研究中脱离出来，成为个性化服务中的基础技术研究.在有关用户建模的研究中，需要用户参与的示例用户建模方法是研究的主流.PAZZANI和BILLSUS［1］通过用户对浏览页面的标注获取用户感兴趣与不感兴趣的页面作为训练样本，而后通过计算单词的期望信息增益，选择期望信息增益最大的128个单词构成用户模型.但是，该方法严重干扰用户的正常浏览，降低个性化服务系统的易用性. 　　为了提供更加友好的个性化服务，研究者着手自动用户建模的研究.SUGIYAMA等人［2］将示例的获取由用户参与转化成自动获取，根据用户对页面浏览行为(如浏览时间)来判断页面属于用户感兴趣类或者用户不感兴趣类；在获得页面所属的兴趣类别后，再采用示例用户建模方法构建用户模型.该方法虽然实现简单，但是没有考虑用户兴趣的多样性，仅仅将文档分为感兴趣和不感兴趣两大类，不能详细描述用户兴趣爱好，也容易引入噪声，不利于构建高质量的用户模型. 　　目前国内已有多家机构