- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
移动环境下个性化推荐系统设计实现
移动环境下个性化推荐系统设计实现
【摘要】随着移动互联网的发展,在移动网络有效获取信息将会变得愈发的困难。个性化推荐技术的提出与应用,使得传统Internet上信息过载的局面得到了一定程度上的缓解。本文在现有的推荐算法的基础之上提出了一种基于用户分类与记录可信度加权的协同过滤推荐算法。并使用J2ME技术设计了一个移动网络个性化推荐原型系统。
【关键词】个性化推荐;移动网络;J2ME;协同过滤;记录可信度
1.引言
近年来,随着移动互联网的迅速发展,特别是国内3G牌照发放后,移动互联网用户增长迅速。根据中国互联网络信息中心(CNNIC)发布的《第30此中国互联网络发展状况统计报告》显示,2012年上半年中国互联网电脑网民规模达到5.38亿,而手机网民数量将达到3.88亿。据DDCI互联网数据中心预测,到2013年中国手机网民将达7.2亿,首次超越电脑网民[1]。随之而来的是移动互联网上各类信息的爆炸式增长,使得人们通过移动网络获取信息更加方便的同时,也使得人们获取有价值的信息愈发的困难。
为解决Internet上信息淹没的现状,个性化推荐技术得到了广泛的应用。针对移动互联网的特殊性,本文把传统Internet上个性化推荐技术应用到移动互联网上,提出了移动个性化推荐的离线解决方案,并且设计了基于J2ME的移动个性化推荐系统。
2.ATC与CF结合的推荐模型
2.1 相关技术概述
为解决文本分类中人为因素的影响,自动文本分类(Automatic Text Cat-egorization)技术得到了快速的发展与应用。目前比较常用的有KNN,朴素贝叶斯分类,SVM等分类方法。这些方法都是建立在统计学的基础上,通过特征提取来标注文本文档,建立文档模型后不同的方法应用不同的分类器来进行文本分来处理。文本分类建立在大量文档的基础之上,从而消除了不同的人对文档文类不同的分歧,使得分类过程不受人为因素的影响。
协同过滤(Collaborative Filt-ering,CF),又称协作型过滤,是在信息过滤与信息发现领域非常受欢迎的技术。一个协作型过滤算法通常的做法是对一大群人进行搜索,从中找出与当前用户喜好相同的一小群人,并且对这些人的偏好内容进行考察,将结果组合起来构造出一个经过排名的推荐列表[2]。协同过滤技术分为基于用户相似性的协同过滤(User-based),基于推荐项目的协同过滤(Item-based)与基于模型的协同过滤(Model-based)三种基本方式。User-based协同过滤是发现相似用户群体,根据相似用户的浏览记录来进行兴趣发现并推荐给用户;Item-based协同过滤计算推荐项目之间的相似性,把与用户以前浏览的项目相似的项目推荐给用户;Model-based协同过滤首先建立个性化推荐的数学模型,根据数学模型来计算推荐集。
本文主要应用朴素贝叶斯分类器与基于项目的协同过滤算法来构建移动网络的个性化推荐系统。
2.2 个性化推荐模型
基于J2ME的移动网络个性化信息推荐系统整体架构如图1所示,系统模型基于C/S结构设计,客户端采用J2ME技术实现手机客户端信息浏览系统,服务器端采用Servlet实现。
由图1可以看出推荐模型可以分为四个主要部分:
1)用户信息采集分为显性的信息采集与隐性信息采集方式。显性的信息采集方式为在用户的终端浏览界面设置信息反馈栏目,在该栏目中用户可以设置自己的使用偏好信息;隐性的信息采集方式为根据用户对信息的浏览时间,对信息是否保存,对信息是否转发等情况对信息内容做出隐性的评价。本文使用5分制规则,对信息保存,转发评分为5分,根据用户对信息浏览时间的长短为信息设置1-5分的分值。
2)信息发布系统主要负责添加推荐信息,在此过程中使用朴素贝叶斯文本分类器对文本类别进行划分。
3)个性化推荐引擎采用基于用户背景信息分类与历史记录可信度加权的Item-Based协同过滤算法产生推荐信息集。
4)终端系统采用基于J2ME技术实现,提供信息浏览与用户偏好采集功能等。
2.3 朴素贝叶斯文本分类
文本分类是将未知的文本类型划分到规定好的类别中,从而降低人为因素的影响。朴素贝叶斯分类以古典数学理论为基础,分类效率稳定,同时模型构建简单,性能优越。因此本文选取朴素贝叶斯分类器作为文本分类的工具。
本文使用的基于朴素贝叶斯分类的文本分类过程如下:
(1)训练文本的向量空间表示
生成向量空间模型的步骤有文本分词处理,除去停用词,特征选择等。经过各个阶段,最终将确定一组特征词作为特征词空间W={w1,w2,w3,…,wm},w表示特征词。将文本映射到该组特征词空间,使文本的表示形如T(A
您可能关注的文档
最近下载
- 40万吨年MDI项目(和山巨力化工)环境影响报告.pdf
- 黑龙江省“六校联盟”2025届高三上学期联合适应性考试数学试题(含答案).pdf VIP
- 福建省高中名校2025学年高三年级第一学期期末数学试卷(附答案)2025.pdf VIP
- 2025高考语文60篇古诗文原文+翻译+赏析+情景默写.pdf VIP
- 掺合料试题带答案.docx VIP
- 2024年湖南高速铁路职业技术学院单招职业技能测试题库及答案解析.docx VIP
- 2024年湖南高速铁路职业技术学院单招职业技能测试题库及答案解析.docx VIP
- 安徽A10联盟2025届高三上学期12月质检考 数学试卷(含答案解析).pdf
- 家庭音乐室另辟蹊径.pdf VIP
- 外加剂掺合料试题带答案.docx VIP
文档评论(0)