矩阵分解对在数据挖掘中的应用分析.docxVIP

矩阵分解对在数据挖掘中的应用分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
矩阵分解对在数据挖掘中的应用分析

Matrix Matrix Factorization in the Application of Data Mining Author’s sign Supervisor’s sign External Reviewers: Qingming Huang Professor UCAS Anonymous Anonymous Examining Commi Examining Commi Zhongfei Zhang Professor ZJU Date oforal defence: June 9th.2014 万方数据 浙江大学研究生学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成 果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 杏挚JR 签字日期:2 al 7c年 石月f7日 学位论文版权使用授权书 本学位论文作者完全了解浙江大学 有权保留并向国家有关部门或机构送交本论文 的复印件和磁盘,允许论文被查阅和借阅。 本人授权浙江大学可以将学位论文的全部或部 分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇 编学位论文。 (保密的学位论文在解密后适用本授权书) 签字日期:沙lf年 占月/7日 篡磊蟛A 学位论文作者签名: 套炎曰B 签字日馘:≯o≯千年6其f7 万方数据 致 致 谢 首先感谢我的导师张仲非教授3年多来对我的指导和帮助。在我的博士生期间,张老 师一直非常关心我的学习和生活,在诸多方面为我排忧解难,帮助我解决在生活中遇到的 各种问题,针对我研究过程中遇到的难题和瓶颈,张老师从来都是耐心的解答,和我一起 研究分析,提出很多创造性的观点,他对工作一丝不苟的作风给了我深刻的影响,将使我 受益终身。在此,我再次向张老师表示衷心的感谢,祝张老师身体健康,工作顺利,万事 如意!感谢我的合作者杨名和祁仲昂同学,你们的帮助对我进行的科学研究起到了极大推 动作用。感谢李玺老师在毕业前几个月里从生活和工作方面给予的悉心指导。感谢实验室 的楼老师和其他同学们,赵学义,金永波,赵品,王跃,何周舟,方正.虞盛康、皮特,张 亚庆,黄思羽,刘喜昂,感谢你们在科研和生活中的帮助和相伴,祝愿你们能在以后的工 作和科研中取得成功。最后还要感谢我的家人,是你们陪我走过了人生中的将近三十个春 秋岁月,一直无私的支持着我的求学道路,使我坚持到现在完成了我的博士学业。 此外,本论文的完成得到了国家科技部973项目(2012CB316400),浙江大学一阿里巴 巴金融联合实验室.浙江省网络媒体云处理和分析工程研究中心.和浙江大学先进媒体信 息处理与智能系统创新团队的资助。 万方数据 摘 摘 要 矩阵分解在很多需要数据挖掘技术的实际应用中非常热门,例如信息检索,机器视觉 和模式识别等领域。矩阵分解旨在使用两个或者更多的低维矩阵来逼近一个高维矩阵。在 现实应用中,数据通常会有各种各样的特点:数据可能会有全局几何结构;数据也可能是 非常稀疏的;训练数据集可能是非常有限的。这就需要人们围绕数据的特点设计不同的矩 阵分解方法。本文研究了矩阵分解在实际应用中的一些突出问题。基于现有的工作,我们 借用不同的数据结构提出了不同的矩阵分解方法,用来解决实际问题。本文的主要工作和 贡献在下面几个方面: 1.针对数据表示中存在的问题,提出了一种坐标排序正则化非负矩阵分解方法,以更 好的利用数据的全局流形几何结构。这个方法的主要思想是结合非负矩阵分解和流形排序 方法来同时利用数据的局部和全局几何结构。在真实数据上的实验结果说明了所提出算法 的优越性。 2.针对科学文章推荐存在的问题,提出了一种主题回归矩阵分解模型。这种分解模型 主要是使用概率主题建模对矩阵分解进行拓展。主题回归矩阵分解模型通过引入一个回归 模型对用户隐藏变量进行正则化,这种正则化是基于一个假设:评价过相似项目的用户有 着相似的偏好。进一步,主题回归矩阵分解模型可以为用户和项目提供可解释的隐藏变量: 并且可以为社区用户作出准确的预测。此外,我们在CiteULike网站提供的一个较大的真 实数据集上验证了算法的效率。实验结果表明本算法在性能上要优于现有的代表性算法。 3.针对科学文章中存在相关性结构的问题,我们提出了主题回归多矩阵分解模型。这 种分解模型可以将主题回归模型和相关性矩阵分解结合起来。此外,我们还提出了带有相 关性矩阵分解的

文档评论(0)

189****6649 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档