基于网格的中医药数据挖掘的研究_临床医学论文.docVIP

基于网格的中医药数据挖掘的研究_临床医学论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网格的中医药数据挖掘的研究_临床医学论文.doc

基于网格的中医药数据挖掘的研究_临床医学论文 基于网格的中医药数据挖掘的研究_临床医学论文 【摘要】 建立在网格基础上的数据挖掘结合了网格技术的优点,能够对Internet上广域分布的海量信息进行高效的处理、分析和挖掘。文章分析了网格与数据挖掘的特点,并将基于网格的数据挖掘技术引入到中医药领域,为中医药的发展开辟了一条新途径。 【关键词】 网格; 数据挖掘; 中医药信息化 随着lnternet的普及和计算机软、硬件技术的发展,以及国家对中医药产业的重视,中医药信息化建设取得初步成效,相继建成了中医药文献数据库、临床医学数据库、中药方剂数据库等一批中医药数据库。随着中医药数据库的建立和发展,数据急剧增加,可是目前用于对这些数据进行分析处理的工具却不是很多。为了获取隐藏在这些数据之后的更重要的信息采用了数据挖掘。通过数据挖掘可以从大量的、不完全的、有噪声的、模糊的随机数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识。但是随着科技和中医药产业的发展,将会产生越来越多的数据,并且和各个领域产生融合,成为了广域产业。那么要分析和挖掘这些广域分布的海量数据,以获取新的科学知识、规律和决策支持,传统的数据挖掘模式和技术已经无法胜任。而网格计算技术是解决复杂海量科学数据的访问存储组织和管理的一种有效技术,是广域分布的异构虚拟组织间实现协同资源共享、多领域的科学和工程的问题求解。建立在网格基础上的数据挖掘结合网格计算的思想及其技术的优点,能够对广域分布的海量数据进行高效的处理、分析和挖掘,将给中医药领域带来新的发展和机遇。   1 数据挖掘和网格   广义上来说,网格是一个集成的资源环境,或者说是一个资源池,它能够充分吸纳各种资源,并将它们转化成一种随处可得的、可靠的、标准的、经济的能力。这些资源包括计算资源、网络通信资源、数据资料、仪器设备、知识等各种各样的资源。网格计算就是基于网格的问题求解[1]。数据挖掘指从数据库或数据仓库中发现隐藏的、预先未知的、有趣的信息的过程,该过程可以看作是知识发现中的一个核心的步骤。数据挖掘就是从大量的数据中发现或挖掘知识,而网格上含有丰富的数据,是数据挖掘的理想目标。网格的数据挖掘建立在数据网格的基础设施和相关技术的基础上,在广域分布的海量数据和计算资源的环境中发现数据模式,获取新的科学知识和规律[2]。   2 基于网格的数据挖掘   2.1 网格数据挖掘过程   2.1.1 数据的处理 数据的处理阶段主要完成从数据网格环境中收集广域分布的数据和计算资源,并对原始数据进行归档处理,更正校对,过滤清理和数据的转换、合并,最后再对经过处理后的数据进行归档。   2.1.2 数据的分析与挖掘该阶段主要完成对处理后的数据进行分析、概括和挖掘,生成关联的规则,发现新的数据关系等,并归档概括出来的数据。   2.1.3 模式的评价该阶段对处理后的数据和归纳后的数据再次进行分析,得出一些数据模式,并评价数据挖掘结果的有效性和可靠性,提交得出的结论或新的关系、趋势。   2.2 网格数据挖掘特点 网格数据挖掘是在已有数据挖掘技术的基础上结合了网格的特点,具有更强的功能。   2.2.1 超强的计算能力网格计算能够为科学计算领域和社会经济生活领域提供超级的计算能力。网格的数据挖掘系统建立在网格计算的技术基础上,数据的传输具有高效的并行性特点,而且数据处理能力超强。   2.2.2 具有分布性和动态性数据分布范围广,在网格计算环境中,广域分布的各种资源都是动态创建和删除的,因此,网格的数据挖掘系统具备分布性和动态性,并以分布计算的方式,同时考虑数据流通负载来分析数据。   2.2.3 具有高性能的I/O负载平衡能力在对广域分布的海量数据处理的过程中,无论是数据的远程传输还是挖掘过程中的数据处理、分析挖掘模式评价等过程,数据的工作流都是很大的,这需要网格提供网络负载调度、管理和高性能的1/ 0负载平衡能力。 2.2.4 高效的数据存储服务、传输服务和复制管理在数据挖掘过程中要进行大数据集存储复制的时候,网格能够提供高效的广域网数据高速缓存服务以解决网络带宽管理的问题;数据传输策略能够支持多种存储系统,并行数据传输,部分文件传输和数据重传、容错能力;数据复制策略能在不同站点之间高速移动和复制数据,保持远程数据拷贝的一致性。   2.2.5 网络安全性要求更高数据挖掘涉及广域分布的属于不同虚拟组织的数据源,数据的安全性和访问权限问题至关重要。在数据存储、转输、复制管理和网络通信过程中,网格操作系统必须具有抗拒各种非法攻击和入侵的能力,保证系统正常高效运行和各种信息的安全(袁 明.基于网格的数据挖掘应用研究[D]. 硕士论文,2007)。   3 基于网格服务的中医药数据挖掘   中医药学具有系统性、整体性、

您可能关注的文档

文档评论(0)

619731806 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档