- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
计算机与现代化
2025年第2期JISUANJIYUXIANDAIHUA总第354期
文章编号:1006-2475(2025)02-0028-05
面向下游任务优化的不平衡数据重采样
郭华
(中国石油大学(华东)计算机科学与技术学院,山东青岛266580)
摘要:数据重采样是解决数据类别不平衡的一种重要方法。传统方法通过最小化样本空间的几何误差构建平衡样本,但
在复杂分布模式的高维空间表现不佳,而且依赖统计特征的方式也缺乏对下游任务的针对性。为了解决这个问题,本文
提出一种基于神经网络的数据采样模型SOD-NN。利用神经网络的非线性处理能力学习样本在高维空间中的分布特
征,并与下游任务联合构造两阶段网络形成整体优化,提升采样过程对下游任务的拟合能力。采样时首先对数据集进行
空间划分,得到的样本子集通过残差处理避免数据退化问题,进而利用自注意力机制构造全局特征,确保与原始样本的
分布一致性。实验结果表明本文模型能有效提升下游分类任务中少数类样本的识别性能,提升下游任务的鲁棒性。
关键词:数据重采样;样本不平衡;自适应采样网络;自注意力机制
中图分类号:TP391.9文献标志码:ADOI:10.3969/j.issn.1006-2475.2025.02.004
ResamplingofImbalancedDataforOptimizingDownstreamTasks
GUOHua
(CollegeofComputerScienceandTechnology,ChinaUniversityofPetroleum(EastChina),Qingdao266580,China)
Abstract:Dataresamplingisakeymethodforcorrectingimbalanceddataset.Traditionalmethodsconstructbalancedsamples
byminimizinggeometricerrorsinthesamplespace,buttheyperformpoorlyinhigh-dimensionalspacewithcomplexdistribu⁃
tionpatterns.Moreover,relyingonstatisticalfeatureslacksspecificityfordownstreamtasks.Toaddressthisissue,thispaper
presentsSamplingforOptimizingDownstreamNeuralNetwork(SOD-NN),aneuralnetworkfordatasampling.Thisapproach
utilizestheabilityofneuralnetworksfornonlinearprocessingtoidentifythedistributioncharacteristicsofhigh-dimensional
samples.Itcombineswithdownstreamtaskstocreateatwo-stagenetwork,enablingoveralloptimization,therebyenhancingthe
model’scapabilitytomeettherequirementsofdownstreamtaskseffectively.Specifically,thedatasetisfirstdividedspatially
duringsampling.Residualprocessingofsamplesubsetsisthenappliedtopreventdatadegradation.Subsequently,aself-
attentionmechanismisutilizedtoconstructglobalfeature,ensuringconsistencywiththeoriginalsam
您可能关注的文档
最近下载
- SY∕T 5367-2023 石油可采储量估算方法.xdf.pdf
- 内审及管理评审基础知识和流程培训.pptx VIP
- 2025年深圳市普通高中高二年级调研考试英语含答案.pdf VIP
- 220kV双回输电线路钻越500kV高电压线路方法.pdf VIP
- 医院抗菌药物临床应用培训.pptx VIP
- 2026年日历全年打印一张纸大字体横向排版带农历带节假日可编辑.xlsx
- 2026-2030中国氢能装备行业发展形势与前景规划分析研究报告.docx
- 国家开放大学(电大)《营销管理》1-11章单元自测答案.pdf
- 24CJ113-1 金属板建筑构造(一)—360°夹胶直立锁缝金属屋面系统.docx
- WST 406—2024临床血液检验常用项目分析质量标准.pdf VIP
原创力文档


文档评论(0)