CN110097098B 基于基分类器的数据分类方法及装置、介质和电子设备 (腾讯科技(深圳)有限公司).docxVIP

CN110097098B 基于基分类器的数据分类方法及装置、介质和电子设备 (腾讯科技(深圳)有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN110097098B(45)授权公告日2025.07.08

(21)申请号201910314159.3

(22)申请日2019.04.18

(65)同一申请的已公布的文献号申请公布号CN110097098A

(43)申请公布日2019.08.06

(73)专利权人腾讯科技(深圳)有限公司

地址518000广东省深圳市南山区高新区

科技中一路腾讯大厦35层

(72)发明人李欣

(56)对比文件

CN109242021A,2019.01.18

王秀霞.分类器的选择性集成及其差异性研究.中国优秀硕士学位论文全文数据库信息科技辑.2011,第2-5章.

审查员刘宗明

(74)专利代理机构深圳市联鼎知识产权代理有

限公司44232专利代理师刘抗美

(51)Int.CI.

GO6F18/24(2023.01)

权利要求书3页说明书15页附图5页

(54)发明名称

基于基分类器的数据分类方法及装置、介质和电子设备

(57)摘要

CN110097098B本发明公开了一种基于基分类器的数据分类方法及装置、计算机可读介质和电子设备,涉及机器学习技术领域。该数据分类方法包括:确定多个基分类器组合,计算各基分类器组合的准确性指标和多样性指标;根据各基分类器组合的准确性指标对各基分类器组合进行排序,并确定各基分类器组合的准确性排序值;根据各基分类器组合的多样性指标对各基分类器组合进行排序,并确定各基分类器组合的多样性排序值;根据各基分类器组合的准确性排序值和多样性排序值计算各基分类器组合的评价指标,将评价指标最大的基分类器组合中的基分类器确定为选择出的基分类器,利用选择出的基分类器对待分

CN110097098B

确定多个基分类器组合,计算各基分类器组合的准确

性指标和多样性指标;其中,各基分类器组合由预定

数量个基分类器组成

根据各基分类器组合的准确性指标对各基分类器组合进行排序,并确定各基分类器组合的准确性排序值

根据各基分类器组合的多样性指标对各基分类器组合进行排序,并确定各基分类器组合的多样性排序值

根据各基分类器组合的准确性排序值和多样性排序值计算各基分类器组合的评价指标,将评价指标最大的

基分类器组合中的基分类器确定为选择出的基分类器,利用选择出的基分类器对待分类数据进行分类

S42

S44

S46

S48

CN110097098B权利要求书1/3页

2

1.一种基于基分类器的数据分类方法,应用于包括多个基分类器的集成分类器,其特征在于,包括:

获取待选择的基分类器的总数量M,M为大于2的正整数;利用预先构建的与分类任务相关的映射表,通过分类任务确定预定数量m,m为正整数且1m≤M;根据所述基分类器的总数量M和所述预定数量m确定基分类器组合的数量],所述基分类器组合由m个基分类器组成;根据N个所述基分类器组合分别对信用评分模型建模样本进行分类,得到所述信用评分模型建模样本的预测结果;所述信用评分模型建模样本包括信用好的用户样本和信用差的用户样本,所述信用好的用户样本与所述信用差的用户样本之间的数量差距大于预设平衡阈值;

根据混淆矩阵计算各所述基分类器组合的准确性指标和多样性指标,所述混淆矩阵包括所述预测结果和真实情况下的类别信息;

根据各所述基分类器组合的准确性指标对各所述基分类器组合进行排序,并确定各所述基分类器组合的准确性排序值;

根据各所述基分类器组合的多样性指标对各所述基分类器组合进行排序,并确定各所述基分类器组合的多样性排序值;

确定所述基分类器组合的数量;

利用所述基分类器组合的数量和所述基分类器组合的准确性排序值确定第一数值,并利用所述基分类器组合的数量和所述基分类器组合的多样性排序值确定第二数值;

配置所述第一数值的权重为第一权重,并配置所述第二数值的权重为第二权重;其中,所述第一权重与所述第二权重均大于等于0,且所述第一权重与所述第二权重之和为1;

利用所述第一权重与所述第二权重计算所述第一数值与所述第二数值的加权调和平均数,使得所述加权调和平均数最大,并将最大的加权调和平均数确定为所述基分类器组合的评价指标;所述加权调和平均数的计算公式如下:

WAD_Ranka,g(AUCRank,DivRank)=

其中,WAD_Ranka,β(AUCRank,DivRank)为所述加权调

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档