- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向海量数据系统研究
面向海量数据系统研究
摘 要: 在处理大数据时,传统的推荐系统,如常规协同过滤的推荐性能受到了限制。使用操作简便的K均值聚类算法与协同过滤构成组合推荐算法具有较好的推荐性能,该文使用遗传算法对组合推荐算法进行优化,简化组合推荐算法,降低组合算法的复杂度和成本。同时,通过对遗传算法进行改进,以提高遗传算法的优化能力,提高推荐系统性能。最后,通过MovieLens电影打分数据集对该文研究的推荐算法进行性能测试。结果表明,遗传算法的优化能力得到提升,推荐系统的性能有所提高。
关键词: 大数据; 推荐系统; 协同过滤; 遗传算法; K均值聚类
中图分类号: TN911?34; TP18 文献标识码: A 文章编号: 1004?373X(2016)12?0059?03
Abstract: When dealing with large data, the traditional recommendation system, such as conventional collaborative filtering, is limited in its recommendation performance. The combination recommendation algorithm formed by K means clustering algorithm and collaborative filtering algorithm has better recommendation performance. The genetic algorithm is used in this paper to optimize the combination recommendation algorithm to simplify the algorithm so as to reduce the complexity and cost of the combination algorithm. At the same time, the genetic algorithm is ameliorated to improve the optimization ability of the genetic algorithm and the performance of the recommendation system. The performance test of the recommendation algorithm was carried out by means of the MovieLens film scoring data set. The test results show that the optimization ability of the genetic algosithm and the performance of recommendation system have been improved.
Keywords: big data; recommendation system; collaborative filtering; genetic algorithm; K means clustering
0 引 言
随着互联网的不断发展,互联网信息数据量正呈现出爆炸式的增长,已经进入了大数据时代,大数据正在引领一场新的技术革命。在互联网的海量数据中寻找用户关心感兴趣的信息正是推荐系统诞生的目的。推荐系统经过不断发展和更新,已经拥有了相对成熟的技术,其中最有效的技术之一即是协同过滤。协同过滤能够对用户的个性信息进行记录和提取,并使用这些信息建立用户模型,使用推荐算法建立的推荐系统将符合用户兴趣的信息主动地推荐给用户。协同过滤推荐系统实际上可以认为是一种打分预测过程。以向用户推荐其感兴趣的电影为例,推荐系统能够根据用户观看的电影历史信息以及该用户本身的个性化信息,并通过一定的推荐算法向用户推荐其可能感兴趣的电影[1?6]。
在处理大数据时,传统的推荐系统的性能受到了限制,在大数据环境下的推荐系统需要考虑大数据的特性,首先大数据环境下,推荐系统需要有更加强大的数据处理性能,因为需要处理的数据量更加庞大并且存在更高冗余以及噪声的数据。其次大数据环境下,推荐系统需要有更快的更新速度,以满足海量数据处理能力。最后,大数据环境下,推荐系统需要有更加精确的推荐能力,以解决信息过载问题。对于大数据环境下的推荐任务,常规协同过滤的推荐效率较低。使用K均值聚类等操作简便的聚类算法与协同过滤构成混合推荐算法具有较好的推荐性能,Google 以及Amazon等大型网络公司的推荐系统均
您可能关注的文档
最近下载
- 中级财政税收-中级经济师《财政税收实务》押题密卷2.docx VIP
- 陕西煤业化工集团有限责任公司生产安全事故应急预案(1).pptx VIP
- DB65T 4929-2025儿童福利机构 义务教育阶段重度残疾儿童少年送教上门服务指南.docx VIP
- 建筑抗震支吊架通用技术条件.pdf VIP
- 医学基础知识复习资料.docx VIP
- 全口义齿汇总.ppt VIP
- 如何购买电脑.pptx VIP
- 急性一氧化碳中毒诊治专家共识.pptx VIP
- (正式版)DB65∕T 4929-2025 《儿童福利机构 义务教育阶段重度残疾儿童少年送教上门服务指南》.docx VIP
- 《混凝土外观质量缺陷及治理措施》ppt课件模板.ppt VIP
原创力文档


文档评论(0)