- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
校园移动互联网业务个性化推荐算法的研究
校园移动互联网业务个性化推荐算法的研究
摘 要:随着移动互联网技术的普及和移动互联业务的爆炸性增长,互联网业务个性化推荐技术日益受到重视,其中协同过滤算法是应用最为广泛的推荐算法之一,但是在校园移动互联网应用中,传统的协同过滤算法难以准确定位目标用户的最近邻,因此其推荐效果并不理想。本文将业务影响权重参数引入协同过滤算法中以便更加精确计算校园用户间的相似度,同时采用层次分析法(APH)确定权重数值,最后采用实际收集的数据进行算法仿真实验,结果表明该算法较传统协同过滤算法具有较好的推荐精度。
关键词:个性化推荐;协同过滤算法;APH;相似度计算
随着移动通信网络的发展和智能手机的普及,移动互联网业务日益丰富着人们的生活,移动增值业务的数量也呈现爆炸性的增长[1],[2]。与此同时,不论是用户还是运营商都感觉到了类型繁多的业务和多元化的用户需求之间信息连接的迫切性,移动互联业务的个性化推荐研究由此进入了人们的视线。其中,协同过滤算法是应用最为广泛的推荐算法之一。
协同过滤算法由Goldberg等在1992年提出,其主要原理是如果某些用户对一些业务的评价很相似,那么他们对其他业务的评价也会很相似。目前协同过滤算法主要分为两类:1)基于用户的协同过滤算法:该算法的关键在于寻找与目标用户具有相似兴趣的最近邻居,将这些邻居的选择推荐给目标用户。2)基于项目的协同过滤算法:该算法的关键在于使用目标用户对相似项目的评分来预估该用户对某个新项目的评分,根据评分的高低来决定推荐的次序[3]。总体来看基于用户的协同过滤算法更适用于移动互联网业务的个性化推荐。
1 传统的基于用户的协同过滤算法
该算法的核心思想是根据用户对各种业务的评价情况统计出与目标用户兴趣最为接近的用户群,称为目标用户的“最近邻居”。目标用户对某个未曾使用的业务的评价可以基于他的“最近邻居”对该项业务的评价结果预测得到。根据不同业务的预测评价决定该业务的推荐排序。移动增值业务中,传统的协同过滤推荐算法是按照以下步骤进行:
(1)建立不同用户对于各项业务的评分矩阵R(m,n),代表共有m个用户和n种增值业务,矩阵元素Rij代表用户i对业务j的评分,取值区间一般位于[0,1]之间。
(2)为目标用户寻找最近邻居集。通过计算用户之间的相似度,为目标用户形成相似度从大到小排列的邻居集合。用户i和用户j的相似度的计算采用Pearson相关度计算公式:
式中,用户i和用户j共同评分过的业务集合为Iij,Ri,k表示用户i对业务k的评分, 和 表示用户i和j对业务的平均评分。
(3)根据目标用户的最近邻居集合对某项业务的评分来预测目标用户对该项业务的评分,并根据预测评分的高低决定业务的推荐排序。用户u对项目i的预测评分为:
式中,Su是目标用户u的最近邻居集合。 和 分别表示用户u和用户n对增值业务的平均评分。Sim(u,m)表示用户u和用户n之间的相似度。Rn,i表示用户n对业务i的评分。
很明显,该算法在计算用户相似度时,并没有权重值,或者说对每项业务赋予相同权重,因此对某些用户群体,如校园互联网用户,该算法是不适用的,需要进行改进。
2 校园移动互联网用户的特殊性
校园用户是目前移动互联网增值业务的主要用户群体之一,他们年龄段集中,学历经历相似,时间较空闲,集聚性强同时经济能力有限,因此他们对于增值业务的选择有一定的趋同性。从我们收集分析的1000份在校大学生增值业务使用情况的调查问卷的数据看来,有多项业务开通比率超过50%,其中最高的彩信业务开通比率接近70%。在此情况下,如果采用传统的相似度计算方法,那么就很难真正区分出真正具有相同兴趣的用户。因此对于相似度计算算法必须进行改进以适应校园用户的特殊性。
3 算法的改进
为使用户间相似度的计算值能够更加准确地描述校园用户间个人兴趣的相似度,我们对被校园用户过于广泛使用的业务赋予较低的权值,这样用户间的相似度计算值将会更加精确。
为了将我们对各项业务重要性的定性分析转变为具体权值,在此引入了层次分析法(APH)。该方法由美国运筹学家T.L.saaty于上世纪70年代提出,是一种将定性和定量结合起来的系统分析方法,它将人的主观判断数量化。在此处应用该方法,我们可以用收集的实证数据和经验判断各业务之间的相对重要程度,并给出每种业务的影响权重。层次分析法的一个重要特点就是用两两重要性程度之比的形式表示出两个方案的相应重要性程度等级。在本文里我们对所涉及业务进行两两对比,并按其重要性程度评定等级。
在此处运用AHP方法,大体可分为以下三个步骤:
步骤1:分析各增值业务间的关系,建立主观判断的客观化标度;
步骤2:对各项业务的重
您可能关注的文档
- 校企合作培养高的技能创新人才.doc
- 校企合作大学生专业实用的技能人才培养的模式及其机制.doc
- 校企合作培养的模式的研究.doc
- 校企合作培养高职化工类高的技能人才.doc
- 校企合作培养的模式下高职院校酒店管理专业现代学徒制发展对策.doc
- 校企合作培养高的素质的应用型人才.doc
- 校企合作培养机械制造业的应用型人才探索.doc
- 校企合作对促进就业的作用的研究.doc
- 校企合作工学结合教学的模式建立之问题的探讨.doc
- 校企合作工学结合的模式实施有效性的研究.doc
- 2024年陆川县事业单位联考招聘考试历年真题带答案.docx
- 2024年翼城县事业单位联考招聘考试真题汇编新版.docx
- 2024年荔波县事业单位联考招聘考试真题汇编完美版.docx
- 2025年曲阳县事业单位联考招聘考试真题汇编最新.docx
- 2024年静乐县事业单位联考招聘考试真题汇编新版.docx
- 2025年石柱县事业单位联考招聘考试历年真题新版.docx
- 2024年蓝田县事业单位联考招聘考试真题汇编汇编.docx
- 2025年辽阳县事业单位联考招聘考试真题汇编完美版.docx
- 2026广东深圳市事业单位集中招聘高校毕业生658人笔试参考题库(医疗岗162人)附答案解析.docx
- 2026年益阳职业技术学院单招职业技能测试题库推荐.docx
原创力文档


文档评论(0)