基于逻辑回归的多任务域快速分类学习算法.docVIP

下载本文档

19
0
约 5页
2017-06-28 发布于福建
举报
版权申诉

基于逻辑回归的多任务域快速分类学习算法.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于逻辑回归的多任务域快速分类学习算法

基于逻辑回归的多任务域快速分类学习算法　　摘要：采用多任务学习方式主要是通过对不同任务域之间的共性特征进行寻找并共享而完成，而对于不同任务域的学习来说，采用知识迁移加速的方式可以为每个任务域构建分类器。鉴于此，本文提出基于罗杰斯特回归模型的多任务学习方法，并在人工及真实数据集上进行验证，结果表明该此种学习算法在实际应用的过程中具有较高的识别率，具有令人满意的识别速度以及鲁棒性关键词：逻辑回归多任务域快速分类学习算法罗杰斯特回归模型中图分类号：TP391 文献标识码：A 文章编号：1007-9416（2016）11-0123-01 多任务学习方法主要是指在采用迁移学习方法的基础上，对单任务域的学习性能可以通过多个彼此关联的相似域学习进行改善。本文在多任务学习方法中应用罗杰斯特回归模型，通过对所有任务域分类器构造一致性模型，从而最大化地对不同任务域学习进行获取。而目前大部分多任务学习方法主要是利用非线性核函数，而多任务学习已经在图像处理、自然语言处理以及文本分类等多个领域的罗杰斯特回归函数分类模型中得到应用，因而在实际应用中具有非常高的分类精度以及效率 1 多任务域学习多任务学习将具有非常广泛的应用领域以及应用前景，将多任务域快速分类学习算法应用于进行学校网页分类时单纯人工收集及辨别标注往往能起到事倍功半的效果。在此过程中是采用多任务学习方法将每个学校的网页数据作为一个任务域，然后通过对多个任务域的学习来对其共性特征进行获取，最终再综合指导各个任务域的分类学习。但若仅仅只有一所学校，就只需要针对单任务目标域的学习，因而采用传统的算法即可。本文所研究的是多任务分类学习，研究的主要目标为彼此相似但却需要满足不同数据分布的多个任务域。将多个任务学习进行合并或者对每个任务域设计一个独立的设计分类器等方法均在实际应用的过程中存在缺陷。其中合并多个任务学习的方法没有关注到不同任务域之间的差异，而大样本域指导所存在的偏向性会在一定程度上干扰稀有域学习。而独立分类器学习没有重视到任务域之间存在的共性特征，因而在实际应用的过程中对分类精度有所下降。多任务域学习在实际应用的过程总具有自身较为独特的优势，在罗杰斯特回归模型提出之前有很多学者提出不同的多任务算法，尽管其中一部分算法在后来的实验中证明有效，但大多仅仅只是针对于小样本的学习 2 基于逻辑回归多任务域快速分类学习算法 2.1 罗杰斯特回归函数罗杰斯特回归函数被认为是一种最为常用且最为有效的分类方法，此函数在图像处理、文本分类以及语义识别中得到了较为广泛的应用。在二分类里Y={+1，-1}罗杰斯回归函数模型为：其中Y代表为离散值，X代表连续量或者离散量，此函数可以用P（Y/X）概率函数进行预测。此函数可以为每组任务域构建其与之对应的分类器，并设置参数概率分布模型，采用训练集学习获得最优参数 2.2 MTC-LR-Cddual大样本快速算法为了能够在机器学习领域中快速地提高分类的准确率，在计算的过程中需要大样本高维数的数据作为次算法的支撑，罗杰斯特回归函数算法在面对大样本数据的过程中也存在效率低下的问题。MTC-LR-Cddual大样本快速算法对偶表达式为：此算法的时间复杂度与数据的规模nk呈线性关系，因而风场适合面对大样本数据的运算。同时，由于此算法时间复杂度与任务域数据集的维数K呈线性关系，因而可以在高维的角度对大样本数据进行运算 3 结果分析根据相关的实验表明，在不同的数据规模下MTC-LR-CDdual算法均能正常运行，在小样本下罗杰斯特回归函数运行速度要快于MTC-LR-Cddua算法，但当样本量增大后，MTC-LR-Cddua才显现出其快速性。这说明不同数据规模均能采用MTC-LR-CDdua算法，且在小样本数据下MTC-LR-Cddual接近于罗杰斯特回归函数分类精度，且精度不会有较大损失 4 讨论罗杰斯特回归函数是通过耦合多任务域之间的共性信息来克服分类偏差产生的影响，从而能够在一定程度上提高个体分类器的精度。在罗杰斯特回归函数算法的基础上，将大样本快速算法CDdual延伸扩展至多任务域分类学习后形成的快速版本MTC-LR-CDdual。通过相关的实验数据表明此种算法具备一定的有效性、快速性以及精度。因此，我们得出面对小样本量的多任务分类学习方法可以采用罗杰斯特回归函数算法，而面对大样本数据集则更加适用于MTC-LR-CDdua算法。但由于本次研究过程中的所有任务域均具备相同数量的特征属性，但在实际应用中会面对不同的功能特征属性，因此域对于多任务学习的权重不同，这就要求在实际应用中进一步研究，以选择更加合适的算法参考文献 [1]郭华平，董亚东，邬长安，等.面向