基于主动学习的网络数据分类方法分析-计算机科学与技术专业论文.docxVIP

下载本文档

5
0
约6.33万字
约 68页
2019-04-19 发布于上海
举报
版权申诉

基于主动学习的网络数据分类方法分析-计算机科学与技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定，即z 学位论文著作权归属苏州大学。本学位论文电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中心、中国科学技术信息研究所〈含万方数据电子出版社)、中国学术期刊(光盘版〉电子杂志社送交本学位论文的复印件和电子文档，允许论文被查阅和借阅，可以采用影印、缩印或其他复制手段保存和汇编学位论文，可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文口本学位论文属在一一一年一一月解密后适用本规定。非涉密论文口论文作者签名 z 日期z 旦旦日期:2;ólr ‘? 基于主动学习的网络数据分类方法研究摘要基于主动学习的网络数据分类方法研究中文摘要随着信息技术的快速发展，各种各样的复杂网络，如社会网络和生物网络等，也随之产生，这些网络的广泛应用产生了海量的数据。对网络数据进行分类是机器学习和数据挖掘领域的一个重要问题，已被广泛地关注和研究。对网络数据进行分类，不仅要考虑如何利用样本数据自身的特征属性，而且要考虑如何利用样本数据间的相互关系，这与传统的数据分类有较大的区别。因此，相对于传统的数据分类，网络数据分类是一个重要且亟待研究解决的问题。本文深入地研究了网络数据分类以及主动学习技术的相关内容，提出了基于主动学习的网络数据分类方法框架，以及在网络数据下不同的主动学习方法。具体包括以下几个方面的工作： (1) 针对主动学习中的采样策略这一关键问题，分析了现有的不确定性、代表性和多样性准则的具体度量方法，结合网络数据的特性，探讨具体度量方法在网络数据分类中的作用。为后续的研究提供理论基础。 (2) 主动学习方法中不同采样策略从不同的角度衡量样本的信息含量，对最终挑选样本的贡献度不一致。为了有效地利用网络数据间的相互关系，提出了一种自适应地融合不同采样准则的主动学习网络数据分类方法，该方法能动态地调整各个准则的贡献度，有效地估计样本的信息含量，从而保证能够挑选出高价值的样本进行标注。 (3) 批处理主动学习方法一次挑选多个样本进行标注。为充分考虑网络数据样本的特点，通过衡量样本的不确定性、代表性和多样性，构建样本关系矩阵，提出了一种基于最优样本子集的批处理主动学习方法，该方法能够挑选出最优样本子集交由人工专家标注，快速获得分类器，同时保证分类器具有较好的泛化性能。本文在网络数据集上通过实验对提出的方法进行验证，并对实验结果进行分析，验证了本文提出的方法的有效性。关键词：主动学习，网络数据，批处理，相互关系，采样策略作者：徐海辉指导老师：崔志明（教授） I Abstract Research on Networked Data Classification Based on Active Learning Research on Networked Data Classification Based on Active Learning Abstract With the rapid development of information technology, it has produced a variety of complex networks, such as social networks and biological networks. The wide application of these networks has generated large amounts of networked data. Classification in networked data is recently an important issue in the field of machine learning and data mining and has been widely concerned and researched. For classification of networked data, not only considering how to utilize the characteristics of networked data, but how to exploit the links between networked data. It has a big difference with the traditional data classification. Therefore, classification in networked data is an important and urgent issue to