- 1、本文档共6页,其中可免费阅读4页,需付费100金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
在二元分类问题中经常会出现样本不平衡问题,样本不平衡是指一个类的实例(多数类)明显多于另一个类(少数类)。而在实际应用中,正确识别少数类实例往往更有价值,例如,在故障诊断中,正常状态远远多于故障状态,但是正确识别故障状态更有意义。目前绝大多数的机器学习算法针对的是平衡样本集,因此,用常规学习算法来训练不平衡样本集往往产生的是次优模型,其性能和泛化能力较弱[1-2]。
针对二分类问题中的样本不平衡问题,已经提出了很多解决办法,常用的方法有通过抽样的方法重新平衡样本集,如上采样技术;自主选择更有价值的子样本集训练模型,使用其他示例提高模型的性能[3-4];通过调整算法使得学习到的模型更倾向于正确分
文档评论(0)