CN107480435-CN201710641052-一种应用于临床数据的自动搜索机器学习系统及方法.pdfVIP

CN107480435-CN201710641052-一种应用于临床数据的自动搜索机器学习系统及方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN107480435-CN201710641052-一种应用于临床数据的自动搜索机器学习系统及方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 107480435 A (43)申请公布日 2017.12.15 (21)申请号 201710641052.0 (22)申请日 2017.07.31 (71)申请人 广东精点数据科技股份有限公司 地址 510630 广东省广州市天河北路906高 科大厦A-701 (72)发明人 李青海 简宋全 邹立斌 侯大勇  (74)专利代理机构 重庆强大凯创专利代理事务 所(普通合伙) 50217 代理人 隋金艳 陈家辉 (51)Int.Cl. G06F 19/00(2011.01) G06F 17/30(2006.01) 权利要求书1页 说明书5页 附图1页 (54)发明名称 一种应用于临床数据的自动搜索机器学习 系统及方法 (57)摘要 本发明属于医疗大数据处理领域,本发明的 解决的技术问题在于提供一种应用于临床数据 的自动搜索机器学习方法,其具有快速提取临床 数据、为医疗行业研究者提供最优算法、方便医 疗行业研究者调整参数且具有学习能力的功能, 包括如下步骤:S1:临床参数提取,将临床参数记 录在EAV文件或者EXCEL文件中;S2:参数筛选,用 MapReduce框架支持在SPARK上执行枢轴,在 SPARK上执行枢轴用来提取有效的临床参数;S3: 在机器内预制若干的推荐算法模型,然后建立 SQL语句执行可视化查询,根据EAV文件或者 A EXCEL文件内容向用户展示可调用的相关算法, 5 机器通过S4自主确定推荐算法模型及推荐算法 3 4 0 参数。还公开了一种应用于临床数据的自动搜索 8 4 7 机器学习系统。 0 1 N C CN 107480435 A 权 利 要 求 书 1/1页 1.一种应用于临床数据的自动搜索机器学习方法,其特征在于,包括如下步骤: S1:临床参数提取,将临床参数记录在EAV文件或者EXCEL文件中; S2:参数筛选,用MapReduce模型框架在SPARK引擎上执行枢轴,在SPARK上执行枢轴用 来提取有效的临床参数; S3:在机器内预制若干的推荐算法模型,然后建立SQL语句执行可视化查询,根据EAV文 件或者EXCEL文件内容向用户展示可调用的相关算法,机器通过S4步骤自主确定推荐算法 模型及推荐算法参数; S4:调用机器学习函数,利用样本进行机器训练,输出符合要求的精度的推荐算法模型 及参数,然后根据精度确定S3中推荐算法模型,再调用推荐算法中相应的推荐算法参数,并 提取该模型下的精度差阈值τ; S5:根据S3和S4中确定的算法和精确度差阈值τ生成关联表,将每个EAV文件或者EXCEL 文件处理成对应的关联表,每个关联表生成时,输出界面显示第一批元组。 2.根据权利要求1所述的应用于临床数据的自动搜索机器学习方法,其特征在于,在S3 中机器的学习功能是通过修改开源代码或是调用MLlib的java的应用程序界面来实现机器 学习函数的。 3.根据权利要求1所述的应用于临床数据的自动搜索机器学习方法,其特征在于,在S3 中,机器是通过Weka实现确定算法模型与S4步骤共同确定算法模型的。 4.根据权利要求1所述的应用于临床数据的自动搜索机器学习方法,其特征在于,还包 括S6:校准提醒,机器对第一批元组进行模型精确度预估,若机器给出了比精确度差阈值τ 更低的推荐算法模型精确度,则提醒用户返回S1增加临床参数的样本容量。 5.一种应用于临床数据的自动搜索机器学习系统,其特征在于,包括: 采

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档