数据处理方法及相关设备、系统.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111435463 A (43)申请公布日 2020.07.21 (21)申请号 201910028386.X (22)申请日 2019.01.11 (71)申请人 华为技术有限公司 地址 518129 广东省深圳市龙岗区坂田华 为总部办公楼 (72)发明人 权涛 缪丹丹 孙伟健  (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 郝传鑫 熊永强 (51)Int.Cl. G06N 20/00(2019.01) 权利要求书4页 说明书38页 附图8页 (54)发明名称 数据处理方法及相关设备、系统 (57)摘要 本申请实施例公开了一种数据处理方法及 相关设备、系统。涉及人工智能领域,具体涉及自 动特征工程领域,该方法包括:执行设备对获取 到的第一组数据集中的多个数据特征进行多阶 特征变换,并从多个特征变换得到的数据集中选 择出最优的数据集;其中,在进行第n阶特征变换 时,针对第n组数据集中的每一个数据集,分别进 行特征变换,得到多个候选数据集;计算该多个 候选数据集中每一个候选数据集的第一评估值; 进而,根据每一个候选数据集的第一评估值确定 进入到下一阶特征变换的第n+1组数据集,该第n +1组数据集中数据集的个数小于该多个候选数 A 据集的个数。 3 6 4 5 3 4 1 1 1 N C CN 111435463 A 权 利 要 求 书 1/4页 1.一种数据处理方法,其特征在于,包括: 执行设备获取第一组数据集,所述第一组数据集包括多个数据特征; 所述执行设备对所述第一组数据集中的所述多个数据特征进行多阶特征变换; 所述执行设备从第一集合中确定目标数据集,所述第一集合包括所述多阶特征变换的 过程中每一阶特征变换得到的数据集; 其中,所述对所述第一组数据集中的多个数据特征进行多阶特征变换,包括: 所述执行设备针对第n组数据集中的每一个数据集中的数据特征分别进行特征变换, 得到多个候选数据集,所述第n组数据集为所述第一数据集经过n-1阶特征变换后得到的数 据集,n为大于1的整数; 所述执行设备计算所述多个候选数据集中每一个候选数据集的第一评估值;所述第一 评估值用于评价通过所述候选数据集训练得到的模型的准确度; 所述执行设备根据所述多个候选数据集中每一个候选数据集的第一评估值确定第n+1 组数据集,所述第n+1组数据集中数据集的个数小于所述多个候选数据集的个数。 2.根据权利要求1所述的方法,其特征在于,第一候选数据集为所述多个候选数据集中 的任一个数据集,所述计算所述多个候选数据集中每一个候选数据集的第一评估值,包括: 所述执行设备计算所述第一候选数据集的元特征,所述元特征用于表示所述第一候选 数据集的属性; 所述执行设备将所述元特征输入到第一机器学习模型,以预测所述第一候选数据集的 第二评估值,所述第一候选数据集的第二评估值用于评价所述第一候选数据集训练得到的 模型的准确度; 所述执行设备根据所述第一候选数据集的第二评估值确定所述第一候选数据集的第 一评估值。 3.根据权利要求2所述的方法,其特征在于,所述第一候选数据集包括多个数据特征和 一个标签,所述根据所述第一候选数据集计算所述第一候选数据集的元特征,具体包括: 所述执行设备根据所述第一候选数据集计算第一信息,所述第一信息包括所述第一候 选数据集的多个数据特征中每两个数据特征的数据相似度、分布相似度,所述第一候选数

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档