- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文
中文摘要
重庆大
重庆大学硕士学位论文
I
I
PAGE
PAGE VI
摘 要
协同过滤是目前个性化推荐系统中应用最为普遍和成熟的技术。协同过 滤技术通过分析用户的历史行为记录获取用户之间或者项目之间的相互关系, 然后通过该关系为各个用户或者项目找到他们的最近邻居,然后使用这些最 近邻居为目标用户推荐相关的项目以达到挖掘用户潜在兴趣的目的。但是该 技术仍然存在着数据稀疏性、冷启动、可扩展性和系统脆弱性等问题。本文 主要针对数据稀缺性问题以及系统脆弱性问题进行深入研究,并据此改进传 统协同过滤算法,使其在数据稀疏的情况下具有更高的推荐精度,并且能够 对各种常见的攻击有较好的抵抗能力。
首先,本文指出通常只有那些在计算相似度的时候需要使用缺失数据的 算法才会直接面临数据稀缺性问题。由于皮尔逊相关相似度的计算并不使用 缺失数据,所以在计算皮尔逊相关相似度的时候不需要直接面临数据稀缺的 问题,而是面临着共同评分项数目不同的问题(即“波动因子”问题)。本文在 引出波动因子的问题后,系统分析了相似度在不同波动因子影响下的分布情 况,并根据该分布情况提出一种简单有效的方法消除波动因子对相似度计算 的影响。接着,使用消除波动因子影响的协同过滤算法(包括 user-based 以及 item-based 协同过滤算法)在 Movielens 的数据集上进行实验,实验表明消除 波动因子影响的协同过滤算法在推荐精度上较原始算法有较大的提高。
然后,针对协同过滤算法易受到攻击的问题,本文从用户可信任度的角 度出发,提出一种简单的基于统计的方法来计算各用户的可信任度,并根据 用户可信任度加强协同过滤算法的抗攻击能力。
接着,本文将改进的消除波动因子影响的相似度计算算法应用到传统协 同过滤算法中,并且结合用户可信任度提出了一种抗攻击的协同过滤算法。 为了验证改进后算法的推荐能力以及抗攻击能力,在 Movielens 数据集上进 行实验,实验表明改进后的算法在推荐精度以及抗攻击能力上都比原始算法 有较大的改进。
最后,将本文的研究内容与“第四方就业信息平台”项目相结合进行相关 的应用研究。
关键词:波动因子、用户可信任度、协同过滤
英文摘要
英文摘要
重庆大
重庆大学硕士学位论文
III
III
PAGE
PAGE IV
ABSTRACT
Collaborative filtering technology which has been most widely used is one of the most mature personalized recommendation technology. It tries to calculate the relationship between users or items by analyzing users? historical records, in order to find the nearest neighbors for each user or project. Then, the nearest neighbors are used to recommend items for the target user, in order to achieve the purpose of mining the user?s potential interest. But it has many problems such as data sparseness, cold start, scalability, easy to be attacked and so on. In this thesis, the sparseness and the easy to be attacked problem have been studied in-depth to improve the traditional collaborative filtering algorithms, in order to have a higher accuracy recommendation in the sparse data case, and to have better resistance when face a variety of common attacks.
First of all, we pointed out that those algorithms, which use the missing data to calculate the similarity, will face the sparseness problem directly. While the
您可能关注的文档
- 基于运动过程的视觉感知和脑机接口-生物医学工程专业论文.docx
- 基于移动通信的市民服务系统的设计与实现-软件工程专业论文.docx
- 基于心音信号身份识别算法的研究-控制理论与控制工程专业论文.docx
- 基于形状特征的高分辨率遥感影像目标识别分析-地图学与地理信息系统专业论文.docx
- 基于图像处理技术的条形码识别系统的研究-工业工程专业论文.docx
- 基于知识管理的政府投资项目后评价改进分析-管理科学与工程专业论文.docx
- 基于知识整合的数据流分类算法研究-计算机软件与理论专业论文.docx
- 基于指纹识别的医院管理信息系统的设计与实现-软件工程专业论文.docx
- 基于体裁的金融网页自动分类方法计算机科学与技术专业论文.docx
- 基于指标气体变化规律的煤氧化自燃预报实验研究-安全管理工程专业论文.docx
- 基于小波变换的地震信号去噪研究-检测技术与自动化装置专业论文.docx
- 基于移动终端网上订餐系统的设计与实现-软件工程专业论文.docx
- 基于语音和人脸的情感识别研究-通信与信息系统专业论文.docx
- 基于液固压缩技术葛根总黄酮速释片的研究-药剂学专业论文.docx
- 基于证据理论的多源信息融合技术研究与应用-计算机科学与技术专业论文.docx
- 基于摘要的视频内容检索系统-信号与信息处理专业论文.docx
- 基于现场交接试验的高压电缆交流耐压及局放技术应用研究-电气工程专业论文.docx
- 基于知识重用的HDD履带行走装置快速设计系统研发-机械工程专业论文.docx
- 基于悬丝位移光电传感技术的桥梁动挠度检测-智能交通与信息系统工程专业论文.docx
- 基于虚拟仪器的励磁系统故障诊断的研究-控制科学与工程专业论文.docx
最近下载
- 招标考察作业标准及流程.docx VIP
- 专题15 议论文阅读(原卷版)2025年中考语文真题分类汇编(全国通用).docx VIP
- (完整版)三基三严考试题题库(附含答案).docx
- 专题12.28 添加辅助线构造三角形全等的十四种方法(题型梳理与方法分类讲解)(人教版)(学生版) 2024-2025学年八年级数学上册基础知识专项突破讲与练(人教版).docx VIP
- 2024创新十年未来十年-致敬中国生物医药创新奋斗者们.pdf VIP
- 广东省茂名市化州市2024-2025学年高一上学期11月期中生物试题【含答案解析】.docx VIP
- 将军饮马模型-将军饮马的数学模型.pdf VIP
- 高中语文散文阅读知识点思维导图.docx VIP
- 关于成立工程质量管理领导小组的通知.docx VIP
- 高中英语2025届高考高频词汇(共 688个 ).doc VIP
文档评论(0)