- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN116523602B(45)授权公告日2025.07.01
(21)申请号202310508313.7
(22)申请日2023.05.08
(65)同一申请的已公布的文献号申请公布号CN116523602A
(43)申请公布日2023.08.01
(73)专利权人重庆邮电大学
地址400065重庆市南岸区黄桷垭崇文路2
号
(72)发明人陈奉何杭轩钱鹰陈雪
吕九峦韦庆杰熊炜
(74)专利代理机构北京同恒源知识产权代理有限公司11275
专利代理师廖曦
(51)Int.CI.
GO6Q30/0601(2023.01)
G06Q40/00(2023.01)
GO6F21/62(2013.01)
GO6N3/0895(2023.01)
GO6N3/098(2023.01)
GO6N20/00(2019.01)
(56)对比文件
XinLiu等.Multi-PartyFederated
RecommendationBasedonSemi-SupervisedLearning.《356IEEETRANSACTIONSONBIGDATA》.2023,356-370.
审查员王咏冬
权利要求书5页说明书11页附图3页
(54)发明名称
一种多方半监督学习的金融产品潜在用户推荐方法
(57)摘要
CN116523602B本发明涉及一种多方半监督学习的金融产品潜在用户推荐方法,属于大数据推荐领域,针对金融产品提供方只拥有正样本的己方数据而无法进行推荐的问题,在保护多方数据安全隐私的情况下,联合多方未标记数据进行多次随机采样,构建正负样本均衡的二分类数据集,训练基于基学习器的纵向联邦学习模型,根据其预测结果,从未标记样本数据中选出可靠正样本,多次迭代数据集重构采样、模型训练预测过程,选出批量可靠正样本。本方法有效地解决了只有少量正样本和大量未标记样本的批量推荐,提高了推荐的可靠性,实现了金融产品潜在用户的精准与批量推
CN116523602B
建立产品推荐多方数据集,对其进行预处理、样本对齐,构建正样本数据集和末标记样本数据集。
建立产品推荐多方数据集,对其进行预处理、样本对齐,构建正样本数据集和末标记样本数据集。
在未标记样本数据集中进行随机有放回采样,建立负样本数据集,与正样本数据集构建训练集,而
采样之后未标记样本数据集为预则集。
构建基于基学习器的纵向联邦学习模里,在调练集和预测集上分别进行训练、预测,得到预测集中
每个样本的预测分数。
否
完成深样、调练与预通过程M次?
根据未标记样本数据集中每个样本预测分数总和及其出现在陵期集中次数总和,计算该样本预施为正样本的概率,并进行排序,选出排名靠前的样本作为可靠正样本,加入正样本数据集,同时将它
否
达朝最大选代次数?
是
对选出的所有可靠正样本作为潜在用户进行金融产品精准批量推荐
CN116523602B权利要求书1/5页
2
1.一种多方半监督学习的金融产品潜在用户推荐方法,其特征在于:包括以下步骤:
S1:建立包含购买金融产品用户信息和其他多方用户信息的金融产品潜在用户推荐多方数据集,并对所述金融产品潜在用户推荐多方数据集进行预处理、样本对齐,构建正样本数据集和未标记样本数据集;
S2:在未标记样本数据集中进行随机有放回采样,建立负样本数据集;利用所述负样本数据集与正样本数据集构建训练集,利用未标记样本数据集中未被采样到的样本构建预测集;构建基于基学习器的纵向联邦学习模型,在训练集上进行训练,在预测集上进行预测,得到预测集中每个样本的预测分数;
S3:多次重复步骤S2的采样、训练与预测过程;根据所述未标记样本数据集中每个样本预测分数总和及其出现在预测集中的次数,计算该样本预测为正样本的概率;按照正样本的概率从大到小对所述未标记样本数据集中所有样本进行排序,根据先验知识选出排名靠前的样本作为可靠正样本,并将它们加入到所述正样本数据集中,同时将它们从所述未标记样本数据集中删除;
S4:重复步骤S2-S3,直到达到预设的最大迭代次数;由此,将从所述未标记样本数据集中选出的所有可靠正样本作为潜
您可能关注的文档
- (正式版)DB12∕T 774-2018 《基本医疗保险药品代码》.docx
- (正式版)DB12∕T 775-2018 《防雷装置检测业务规范 》.docx
- (正式版)DB12∕T 777-2018 《天津市行道树苗木质量要求》.docx
- (正式版)DB12∕T 785-2018 《奶牛舍机械刮板清粪 》.docx
- (正式版)DB12∕T 787-2018 《奶牛养殖场肥水农田施用冬小麦 》.docx
- (正式版)DB12∕T 788-2018 《水产养殖物联网水质参数集成在线采集装置技术要求 》.docx
- (正式版)DB12∕T 791-2021 《红色旅游景区(点)评定规范》.docx
- (正式版)DB12∕T 792-2018 《肠道门诊设置与管理指南》.docx
- (正式版)DB12∕T 793-2018 《预防接种门诊消毒工作指南 》.docx
- (正式版)DB12∕T 795-2018 《生活饮用水中5种人工合成甜味剂的测定 液相色谱-串联质谱法 》.docx
原创力文档


文档评论(0)