- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Company Logo LOGO 论文题目:基于SVM的半监督迁移学习的算法研究 姓 名 :*** 年 级 : 专 业 : 指导教师 : 硕士研究生开题报告 开题内容 1 算法的提出及研究意义 2 国内外同类技术研究现状 3 研究内容与研究方法 4 技术路线 5 算法简易描述 硕士研究生开题报告 我们生活在大量数据日积月累的年代。每天,来自网络、商业、社会、科学和工程、医学以及我们日常生活的方方面面的数兆兆字节或数千兆兆字节的数据注入我们的计算机网络、万维网和各种数据存储设备。世界范围的商业活动产生了巨大的数据集,包括销售事务、股票交易记录、产品描述、促销、公司利润和业绩以及顾客反馈。科学和工程实践持续不断地从遥感、过程测量、科学实验、系统实施、工程观测和环境监测中产生多达数千兆兆字节的数据。数据的爆炸式增长、广泛可用和巨大数量使得我们的时代成为真正的数据时代。而将数据转换成有价值的信息的其中一个重要的步骤是分类。分类可以从内容丰富、蕴含大量信息的数据库中提取描述重要信息的数据类,从而作出智能的商务决策,其应用非常广泛。然而针对不同类型的数据,分类的方法却有很多,如贝叶斯分类,支持向量机(SVM)分类,C4.5等。 SVM是机器学习中的重要算法,近年来也得到了广阔的发展,特别是在生物信息、文本分类等领域中。而基本的SVM算法是有监督的的学习算法,它是基于统计学习理论的原理性方法。其主要思想是:建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化。从而 1 算法的提出及研究意义 硕士研究生开题报告 1.1 算法的提出 对分类问题提供良好的泛化能力,所采用的数据往往都需要满足一定条件。 然而在传统的SVM分类方法中,大部分都是有监督的,即用带标签的数据来训练分类模型,并且只局限于目标数据域。然而,收集带标签的实例是非常困难且要耗费巨大的,不带标签的数据却是相当巨大,很容易获取。如果只有少量的带标签的数据和大量未标记的数据可用,那么半监督学习在一定程度上便能弥补因训练数据不足而导致过拟化的分类误区。 很多机器学习的方法,无论是传统的机器学习还是半监督学习问题,都是建立在一个共同假设:测试数据与训练数据属于统一数据分布与同一特征空间。一旦数据分布有差异,很多学习方法便无法表现的很好。重新标记大量数据,这样的代价是昂贵的。基于这个局限,我们便引入了迁移学习,目的是从其他相关辅助数据域中迁移知识去帮助目标域中解决学习任务。因此,迁移学习的出现使的这些问题可以迎刃而解。迁移学习(Transfer Learning)的目标是将从一个环境中学习的知识用来帮助新环境中的学习任务。如Qiang Yang等人迁移学习对于文本挖掘的应用。迁移学习不但解决了训练数据匮乏的问题,而且在某种程度上可能充分的利用了数据的价值。于是我们提出了基于SVM的半监督迁移学习的算法。 硕士研究生开题报告 首先,相对于传统SVM算法,基于SVM的半监督迁移学习算法很好的利用相关领域数据大量带标签的数据来帮助我们目标领域数据的分类万挖掘,在某种程度上既提高了SVM分类器的准确率,又节约了大量的人力物力去标记样本来满足分类器训练的要求。在Web领域方面,还能充分利用过时的数据来帮助新形成的领域进行分析。避免了数据的浪费。 其次,结合半监督学习与迁移学习的算法是现今比较缺乏的研究方向,迁移学习方法理论上可以使得很多传统的分类器的准确率得到进一步的提升,因而迁移学习的研究可以扩展到其他比较经典的数据挖掘算法中,来提高数据分析的准确率。 硕士研究生开题报告 1.2 研究意义 2 国内外研究现状及分析 硕士研究生开题报告 近几年来,基于SVM分类算法的扩展越来越受到研究者的关注,随着相关研究的不断深入,与其他学习方法结合的SVM算法应运而生。目前,人们在基于SVM算法与各种学习技术相结合,提出了不同类型的基于SVM分类方法,以解决不同的实际问题。其方法也陆续被提了出来,像自训练半监督SVM算法、局部化SVM优化方法以及跨域SVM算法方法等。目前迁移学习技术的发展势头强劲,不乏大量迁移学习分类的算法,如TrAdaboost、CDSVM已证实了这一点。究其原因主要是迁移学习在现实中有着广泛的应用前景,如文本分类、Web挖掘、社交网络分析、生物信息学等。 SVM算法的难点在于优化SVM分类器目标函数找到支持向量来构建最优超平面。V.Vapnik提出了基本的SVM分类网络,利用带标签数据进行有监督的训练分类器,最终得到最优分类超平面。由于训练数据与测试数据的分布不一致,训练得到的分类器可能效果不怎么好。 硕士研究生开题报告
您可能关注的文档
- 基于LQR控制二级倒立摆系统研究报告.doc
- GSP药品养护知识总结.doc
- 基于Master_CAM台灯灯罩模具设计_毕业论文开题报告.doc
- 基于MATLABAd Hoc网络AODV协议最小路由选择-本科毕业论文.doc
- 基于MatlabGMSK仿真.doc
- 基于MATLABMIMO-OFDMA系统设计与仿真-毕业论文.doc
- 基于MATLAB300MW机组给水控制系统设计与仿真-能源与动力工程(热动)毕业论文.docx
- 基于MATLABPCM时分复用系统设计与仿真.ppt
- 基于MATLABMIMO系统信道容量及性能分析-毕业论文.doc
- 基于MATLABTCM编译码器设计与实现毕业论文.doc
文档评论(0)