- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要在实际工程问题中,存在大量的类别不均衡问题,如故障诊断、网络入侵检测
摘要
在实际工程问题中,存在大量的类别不均衡问题,如故障诊断、网络入侵检测 等。且该类问题具有明显的时间特点,尤其是在大规模数据环境下,数据通常是按序 到达,是一种典型的在线不均衡分类问题。极限学习机作为一种单隐层前馈神经网 络,具有极端快速的特点,同时其泛化性能良好,可有效解决在线贯序数据的分类问 题。然而,极限学习机通常是以提高样本整体的分类精度为目标,当类别严重不均衡 时,极易导致分类面偏移,造成“虚假”的分类效果。因此,本文将根据数据特点和应 用需求,在前端充分采集数据和处理数据的基础上,进行后端机器学习理论和算法的 研究,提出一系列更适合在线不均衡分类问题的算法。主要工作和贡献如下:
(1)为提高不均衡在线贯序数据中少类样本的分类精度,提出一种基于不均衡样本 重构的加权在线极限学习机算法。该算法的关键是在提取数据分布特性的基础上,对 不均衡样本重构。为此,引入主曲线的概念,并在此基础上改进SMOTE方法,从而 提高少类样本的过采样质量,同时,为突出样本重要性,采用动态加权的思想,根据 训练误差为在线样本赋以相应大小的权重。最终在不增加算法复杂度的前提下,对少 类样本的预测精度更高,同时数值稳定性良好。
(2)针对现有分类算法泛化性能较低的问题,提出一种基于留一交叉验证的在线极 限学习机算法,既实现了对在线泛化误差的快速有效估计,又大大降低了时间复杂 度。为解决在线样本的不均衡问题,根据留一误差进行欠采样,同时,为保证模型的 简约性,采用增删机制动态更新网络权值,并从信息熵的角度给出在线欠采样过程中 存在损失信息上界,进而从理论上证明了该算法的有效性。
(3)为进一步提高不均衡在线数据中少类样本的识别率,同时尽可能减少多类样本 的分类精度损失,提出一种基于混合采样策略的在线极限学习机算法。该算法在遵循 样本分布特性的同时,根据样本重要度指标筛选最具价值的样本点,实现样本重构。 同时为保证模型的泛化性能,根据在线留一误差进行动态模型调整,以确保最优网络 结构,并通过理论分析和大量仿真实验证明该算法的合理性和有效性。
本文研究不仅拓宽了极限学习机的理论与算法研究,也为在线不均衡分类问题提 供了新的解决方案,同时本文所研究的理论和相应算法,均可直接应用于其他领域的
万方数据
信号处理,对于实际工程问题中的不均衡分类问题的解决,如网络入侵检测,疾病诊
信号处理,对于实际工程问题中的不均衡分类问题的解决,如网络入侵检测,疾病诊 断等,也具有良好的借鉴意义。
关键词:极限学习机,不均衡分类,在线贯序数据,主曲线,留一交叉验证
Ⅱ
万方数据
ABSTRACTIn
ABSTRACT
In the删cal engineering problems,there many imbalanced classification problems,such as
fault diagnosis,network intrusion detection.And this kind of problems has distinct time characteristics especially in large-scale data environment.We call this kind of problems as online sequential imbalanced data classification problems.As a single-hidden layer feed-forward neural network,exl托me learning
machine(ELM)has been successfully applied in pattern recognition and regression estimate and other issues because of its very high learning speed and good generalization performance.However,ELM tends to get biased classifier when the training data are seriously imbalanced.Therefore,we proposed some algorithms with better performance to solving sequential data imbalance problem on the basis of fully collecting data and processing.
111e main“mt肌乜and contributi
您可能关注的文档
- 蒙药森登-4复方及其单味药的多糖成分提取及抗氧化作用研究-分析化学专业毕业论文.docx
- 面向大规模多天线系统的传输性能分析及其功控设计-信息与通信工程专业毕业论文.docx
- 面向行业的商品化管理信息系统框架构建与方法研究-管理科学与工程专业毕业论文.docx
- 空间网架结构的验算及外粘钢管加固技术的应用研究-建筑与土木工程专业毕业论文.docx
- 面向电能质量监测的压缩感知采集模式研究-信息与通信工程;通信与信息系统专业毕业论文.docx
- 锰氧化物及其复合纳米材料的制备与性能研究-化学专业毕业论文.docx
- 面向钢铁生产流程的调度模型库系统研究-机械工程专业毕业论文.docx
- 马克思恩格斯的生命哲学思想研究-马克思主义基本原理专业毕业论文.docx
- 面向无纸贸易的在线支付税收协同监管研究-金融学专业毕业论文.docx
- 面向视觉感知的3D视频码率控制算法研究-信号与信息处理专业毕业论文.docx
- 马铃薯分根交替灌溉诱导的旱生生理机制和抗旱基因表达-作物学;作物遗传育种专业毕业论文.docx
- 美赞臣婴幼儿奶粉在中国的营销策略研究-国际商务专业毕业论文.docx
- 面向张量数据的迁移学习研究与应用-控制科学与工程专业毕业论文.docx
- 抗癌药物白藜芦醇在延缓雌鼠生殖衰老中的作用研究-细胞生物学专业毕业论文.docx
- 空分用椰壳基炭分子筛的制备与评价-化学工艺专业毕业论文.docx
- 民国时期竺可桢的政治态度研究-历史学;中国近现代史专业毕业论文.docx
- 面向航空交通系统的复杂网络与网络动力学研究-计算机应用技术专业毕业论文.docx
- 玛纳斯河流域绿洲农业生态系统演替及可持续发展研究-作物栽培学与耕作学专业毕业论文.docx
- 面向软件企业的知识共享管理系统的设计与开发-软件工程专业毕业论文.docx
- 面向感知网的上下文敏感计算技术研究-计算机应用技术专业毕业论文.docx
原创力文档


文档评论(0)