- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107015993-CN201610058562-一种用户类型识别方法及装置
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 107015993 A
(43)申请公布日 2017.08.04
(21)申请号 201610058562.0
(22)申请日 2016.01.28
(71)申请人 中国移动通信集团上海有限公司
地址 200060 上海市普陀区长寿路200号
(72)发明人 潘钢 王远伟
(74)专利代理机构 北京同达信恒知识产权代理
有限公司 11291
代理人 黄志华
(51)Int.Cl.
G06F 17/30 (2006.01)
权利要求书4页 说明书17页 附图4页
(54)发明名称
一种用户类型识别方法及装置
(57)摘要
本发明涉及计算机技术领域,尤其涉及一种
用户类型识别方法及装置,包括:首先获取用户
的指标值,然后根据指标值及预先得到的阈值,通
过识别模型识别所述用户的类型,其中所述阈值
是对样本每个指标进行分组,根据每个分组的组
值得到的。该方法在确定阈值时,是通过对样本每
个指标进行分组,然后根据每个分组的组值来得
到指标对应的阈值,因而该方法对样本进行分类,
得到多个分组,并分别确定每个分组对应的组值,
从而可以基于合理的分组结果,准确有效地确定
指标对应的阈值。
A
3
9
9
5
1
0
7
0
1
N
C
CN 107015993 A 权 利 要 求 书 1/4页
1.一种用户类型识别方法,其特征在于,包括:
获取用户的指标值;
根据所述指标值及预先得到的阈值,通过识别模型识别所述用户的类型;
所述阈值是对样本每个指标进行分组,根据每个分组的组值得到的。
2.如权利要求1所述的方法,其特征在于,所述基于所述指标值,利用识别模型识别所
述用户的类型之前,还包括:
针对样本中的每个指标,根据所述样本在所述指标的取值,对所述样本进行排序;
根据每个样本对应的标签及当前分组阈值,对排序后的样本进行分组,得到第一分组
结果,确定所述第一分组结果对应的第一组熵总和;
将增加一步长值之后的分组阈值作为当前分组阈值,根据每个样本对应的标签及当前
分组阈值,对排序后的样本进行分组,得到第二分组结果,确定所述第二分组结果对应的第
二组熵总和;
若第一组熵总和与第二组熵总和之间的差值不大于停止阈值,则确定所述第二分组结
果中每个分组的组值;
根据每个分组的组值,确定所述指标对应的阈值。
3.如权利要求2所述的方法,其特征在于,所述对排序后的样本进行分组,包括:
按顺序选取排序后的样本中n个未分组的样本,生成样本集合;
根据所述样本集合中每个样本的标签,确定每类标签的样本数;
判断样本数最多的一类标签的比例是否小于当前分组阈值;
若对应样本数最多的一类标签的比例不小于当前分组阈值,则将所述样本集合中的所
有样本划分到一个分组,并返回到按顺序选取排序后的样本中的n个未分组的样本,生成样
本集合的步骤;
若对应样本数最多的一类标签的比例小于当前分组阈值,则按顺序增加m个未分组的
样本到所述样本集合,并返回到根据所述样本集合中每个样本分别对应的标签,确定每类
标签对应的样本数的步骤;
其中,n为大于1的整数,m为正整数。
4.如权利要求3所述的方法,其特征在于,将所述样本集合中的所有样本划分到一个分
组之后,返回到按顺序选取排序后的样本中的n个未分组的样本,生成样本集合的步骤之
前,还包括:
判断当前分组之后的下一个未分组样本的标签与所述分组中对应样本数最多的一类
标签是否相同;
若当前分组之后的下一个未分组样本对应的标签与所述分组中对应样本数最多的一
类标签相同,则将所述下一个未分组样本增
您可能关注的文档
- CN107037192-CN201710453465-一种有效的多指标水质评估系统.pdf
- CN107037175-CN201710366397-少阳感冒颗粒的检测方法.pdf
- CN107037167-CN201710459333-多指标成分定量测定银杏叶中黄酮类成分含量的方法.pdf
- CN107037159-CN201710364533-一种六神曲发酵过程在线质量检测系统.pdf
- CN107041244-CN201710216339-一种提高草坪草抗旱性能的方法.pdf
- CN107036998-CN201611005550-利用近红外光谱法快速检测气滞胃痛颗粒的制备过程中提取挥发油过程的方法及应用.pdf
- CN107036997-CN201610997258-利用近红外光谱法快速检测气滞胃痛颗粒的制备过程的方法及应用.pdf
- CN107036952-CN201710167025-一种风机滤网单元的检测方法.pdf
- CN107036933-CN201710262585-一种沥青路面压实均匀性精细化检测与评价方法.pdf
- CN107036905-CN201710192504-一种岩体结构面二维粗糙度评价方法及系统.pdf
- CN107015987-CN201610056622-一种更新和搜索数据库的方法及设备.pdf
- CN107015961-CN201610053813-一种文本相似性比对方法.pdf
- CN107015892-CN201710203394-一种压力测试方法、装置和系统.pdf
- CN107015863-CN201611070427-一种资源分配方法和装置.pdf
- CN107015567-CN201710464859-一种超大尺度柔性航天器分散协同控制方法.pdf
- CN107015562-CN201710281426-一种满足预设跟踪性能的欠驱动水面船舶控制方法.pdf
- CN107015526-CN201710138267-基于直觉模糊多属性决策的智能数控系统风险评估方法.pdf
- CN107015473-CN201710192626-一种基于调制转移谱稳频的碱金属小光钟及其控制方法.pdf
- CN107015470-CN201710222231-一种结合运动环境检测的智能手表.pdf
- CN107015314-CN201710146928-一种EDFA用微光学混合器件制作方法及装置.pdf
最近下载
- 2025年周口师范学院招聘工作人员19名考试参考题库附答案解析.docx VIP
- 《新时代中国特色社会主义理论与实践(2024年版)》下半部分.pdf VIP
- DB13T 5842-2023 困境未成年人风险分级干预规范.pdf VIP
- 国际消防安全系统规则( FSS Code最新版).docx VIP
- 法学概论(第五版)谷春德-全套课件.pptx
- 英语绘本PPT课件 1-6年级1. The Odd Pet 绘本.pptx VIP
- 建筑安装工程工期定额.pdf VIP
- 钢结构吊装专项施工方案(技术方案).doc
- 中国成人念珠菌病诊断与治疗专家共识解读PPT课件.pptx VIP
- 05S804:矩形钢筋混凝土蓄水池.pdf VIP
原创力文档


文档评论(0)