- 2
- 0
- 约5.69千字
- 约 10页
- 2018-11-02 发布于广东
- 举报
基于网格的中医药数据挖掘的研究..doc
基于网格的中医药数据挖掘的研究
【 】建立在网格基础上的数据挖掘结合了网格技 术的优点,能够对Internet上广域分布的海量信息进行高 效的处理、分析和挖掘。文章分析了网格与数据挖掘的特点, 并将基于网格的数据挖掘技术引入到中医药领域,为中医药 的发展开辟了一条新途径。
【关键词】网格;数据挖掘;中医药信息化 随着Internet的普及和计算机软、硬件技术的发展, 以及国家对中医药产业的重视,中医药信息化建设取得初步 成效,相继建成了中医药文献数据库、临床医学数据库、中 药方剂数据库等一批中医药数据库。随着中医药数据库的建 立和发展,数据急剧增加,可是目前用于对这些数据进行分 析处理的工具却不是很多。为了获取隐藏在这些数据之后的 更重要的信息采用了数据挖掘。通过数据挖掘可以从大量的、 不完全的、有噪声的、模糊的随机数据中,提取隐含在其中 的、人们事先不知道的、但又是潜在的有用信息和知识。但 是随着科技和中医药产业的发展,将会产生越来越多的数据, 并且和各个领域产生融合,成为了广域产业。那么要分析和 挖掘这些广域分布的海量数据,以获取新的科学知识、规律 和决策支持,传统的数据挖掘模式和技术已经无法胜任。而 网格计算技术是解决复杂海量科学数据的访问存储组织和 管理的一种有效技术,是广域分布的异构虚拟组织间实现协 同资源共享、多领域的科学和工程的问题求解。建立在网格 基础上的数据挖掘结合网格计算的思想及其技术的优点,能 够对广域分布的海量数据进行高效的处理、分析和挖掘,将 给中医药领域带来新的发展和机遇。
1数据挖掘和网格
广义上来说,网格是一个集成的资源环境,或者说是一 个资源池,它能够充分吸纳各种资源,并将它们转化成一种 随处可得的、可靠的、标准的、经济的能力。这些资源包括 计算资源、网络通信资源、数据资料、仪器设备、知识等各 种各样的资源。网格计算就是基于网格的问题求解[1]。数据 挖掘指从数据库或数据仓库中发现隐藏的、预先未知的、有 趣的信息的过程,该过程可以看作是知识发现中的一个核心 的步骤。数据挖掘就是从大量的数据中发现或挖掘知识, 而网格上含有丰富的数据,是数据挖掘的理想目标。网格的 数据挖掘建立在数据网格的基础设施和相关技术的基础上, 在广域分布的海量数据和计算资源的环境中发现数据模式, 获取新的科学知识和规律[2]。
2基于网格的数据挖掘
网格数据挖掘过程
数据的处理数据的处理阶段主要完成从数据网格环境 中收集广域分布的数据和计算资源,并对原始数据进行归档 处理,更正校对,过滤清理和数据的转换、合并,最后再对
经过处理后的数据进行归档。
数据的分析与挖掘该阶段主要完成对处理后的数据进 行分析、概括和挖掘,生成关联的规则,发现新的数据关系 等,并归档概括出来的数据。
模式的评价该阶段对处理后的数据和归纳后的数据再 次进行分析,得出一些数据模式,并评价数据挖掘结果的有 效性和可靠性,提交得出的结论或新的关系、趋势。
网格数据挖掘特点网格数据挖掘是在已有数据挖掘技 术的基础上结合了网格的特点,具有更强的功能。
超强的计算能力网格计算能够为科学计算领域和社会 经济生活领域提供超级的计算能力。网格的数据挖掘系统建 立在网格计算的技术基础上,数据的传输具有高效的并行性 特点,而且数据处理能力超强。
具有分布性和动态性数据分布范围广,在网格计算环境 中,广域分布的各种资源都是动态创建和删除的,因此,网 格的数据挖掘系统具备分布性和动态性,并以分布计算的方 式,同时考虑数据流通负载来分析数据。
具有高性能的I/O负载平衡能力在对广域分布的海量数 据处理的过程中,无论是数据的远程传输还是挖掘过程中的 数据处理、分析挖掘模式评价等过程,数据的工作流都是很 大的,这需要网格提供网络负载调度、管理和高性能的1/0 负载平衡能力。
高效的数据存储服务、传输服务和复制管理在数据挖掘 过程中要进行大数据集存储复制的时候,网格能够提供高效 的广域网数据高速缓存服务以解决网络带宽管理的问题;数 据传输策略能够支持多种存储系统,并行数据传输,部分文 件传输和数据重传、容错能力;数据复制策略能在不同站点 之间高速移动和复制数据,保持远程数据拷贝的一致性。
网络安全性要求更高数据挖掘涉及广域分布的属于不 同虚拟组织的数据源,数据的安全性和访问权限问题至关重 要。在数据存储、转输、复制管理和网络通信过程中,网格 操作系统必须具有抗拒各种非法攻击和入侵的能力,保证系 统正常高效运行和各种信息的安全(袁明.基于网格的数据 挖掘应用研究[D].硕士论文,XX)。
3基于网格服务的中医药数据挖掘
中医药学具有系统性、整体性、复杂性、不确定性等特 点,中医药临床积累的信息很多,数据类型及相互关系错综 复杂,不适宜运用传统的还原论的方法研究。将数据挖掘和 知识发现
您可能关注的文档
- 基于扩展EMIS的移动搜索用户持续使用理论模型.doc
- 基于扩展Query引擎的空间数据流查询方法研究..doc
- 基于扩展质量功能展开和网络图的产品大数据分析方法及其应用探讨..doc
- 基于技术不确定性视角的企业R&D边界决策分析框架..doc
- 基于技术吸收能力的我国铝行业技术创新研究..doc
- 基于技术跨越的企业技术学习探讨..doc
- 基于技术路线图的节能技术信息节点式共享研究.doc
- 基于护理专业就业导向的职业学校信息技术课程教学探析.doc
- 基于报表数据的上市公司顾客资产测量与提升..doc
- 基于指数化的方法测度年个人所得税免征额..doc
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
原创力文档

文档评论(0)