- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库基本理论及中药色谱指纹图谱数据仓库构建
数据仓库基本理论及中药色谱指纹图谱数据仓库构建
【摘要】; 目的 探讨构建中药色谱指纹图谱数据仓库的理论与方法。方法 以SQL Server 2000作为数据库开发环境,以OLAP作为联机分析工具,用中药色谱指纹图谱37个特征参数构建多维数据集。结果 采用星型模型构建中药指纹图谱数据仓库的整体框架及数据挖掘模型。结论 该数据仓库的构建为中药色谱指纹图谱的进一步分析与挖掘建立了综合环境与平台。
【关键词】; 数据仓库;ETL;中药色谱指纹图谱;特征参数
基金项目:国家自然科学基金重大研究计划项目;辽宁省教育厅高等学校科学研究项目(05L426)
数据仓库是信息领域中近年来迅速发展起来的数据库新技术。数据仓库的建立能充分利用已有的数据资源,把历史数据转换成为统一的、利于分析的格式,从中挖掘出决策者需要的决策依据,最终创造出效益。数据仓库的出现为解决企业信息系统中存在的“数据丰富,但信息贫乏”的实际情况提供了一种有效的解决方案 [1]。由于中药指纹图谱本身是一个巨大的潜信息库,再加上中药材的基本信息、采用的不同色谱条件、图谱的原始数据等信息将会形成一个庞大的数据库[2]。为充分利用数据资源,解决辅助决策信息贫乏的现状,需要建立一个支持决策的数据仓库,以此为基础进行联机分析和数据挖掘,从而为不同种类药材或制剂的指纹图谱评价及其实验条件的优化提供依据。本文就数据仓库的理论及中药色谱指纹图谱数据仓库的构建作一简单描述。
1; 数据仓库概述
数据仓库是面向主题的、集成的、随时间变化的、稳定的数据集合,用以支持管理决策的制定过程[3]。其特点是:
(1)数据仓库是面向主题的
主题是数据归类的标准,每一个主题基本对应一个宏观的分析领域。中药色谱指纹图谱的数据仓库的主题可以是色谱条件、特征参数、流动相等等。
(2)数据仓库是集成的
数据进入数据仓库之前,必须经过加工与集成。对不同的数据来源进行统一数据结构和编码。统一原始数据中的所有矛盾之处,如字段的同名异议、异名同义、单位不统一和字长不一致等。
(3)数据仓库是稳定的
数据仓库中包含了大量的历史数据。数据经集成进入数据仓库后一般是不更新的,数据仓库除了把从操作性数据库中转换来的数据按照时间顺序添加到前一个时期的数据中的这个过程之外,数据仓库中的信息一般保持固定不变。
(4)数据仓库是随时间变化的
数据仓库是随时间变化的,因为它们要同时维护着历史和当前的数据。数据仓库按照每日、每周或每月的频率从操作性数据库中导入数据,而且一般要保存一段时间。
2; 中药色谱指纹图谱数据仓库的构建
数据挖掘是一种体系结构,而不是一种产品。我们无法购买现成的数据仓库,必须结合实际情况进行构建。所以,数据仓库更多的是一种工程上的概念。
2.1; 中药色谱指纹图谱数据仓库的整体架构设计
中药指纹图谱数据仓库的整体架构设计如图1所示。
2.2; 逻辑模型设计
维度建模是一种逻辑设计技术,维度模型又叫星型模型。维度建模分为4个步骤:(1)确定分析主题。本文主题为中药指纹图谱37个特征参数。(2)定义粒度。由于用户需求的不可预见性,设计时应提供不同色谱条件下特征参数的所有最细节性数据即原子性数据。(3)确定分析的角度和维度。主要有中药材基本信息维、中药制剂基本信息维、方法模式维、洗脱方式维、检测器维、流动相维、HPLC色谱柱维、工作站维、色谱柱维、特征参数维。(4)确定分析的主要指标及事实。在此基础上进行维表的具体设计,根据挖掘主题的需要共设计了10个维表,具体内容见表1。
图1; 中药色谱指纹图谱数据仓库整体架构(略)
表1; 维表设计(略)
ID、柱类型、brand、生产厂商、型号、长度、内径、粒度、填充料8色谱仪维ID、类型、Brand、生产厂商、型号9特征参数维ID、检测波长、指纹峰总数、有效分离率、指纹信号均化系数、指纹峰几何平均面积、指纹峰算数平均面积、峰面积比率、色谱空间占用率、总积分面积和、八强峰归一化面积及位置、三强峰比例、平均峰高、共有峰平均峰宽、最强峰柱效、总分离度、平均分离度、分离度均化系数、表观进样量、色谱指纹图谱进样量校正信息量指数等。
;
确定了主题和维之后,采用星形模型,设计数据模型,其结构如图2所示。
图2; 中药色谱指纹图谱数据仓库星型数据模型(略)
3; 基于OLAP联机分析的数据挖掘的实现;
数据的抽取、转换和加载是数据进入仓库前对数据的处理过程,决定着数据的质量[4]。中药色谱指纹图谱数据仓库是在SQL Sever 2000操作环境中构建的,数据的抽取、转
您可能关注的文档
最近下载
- 2025广西公需科目考试答案(3套,涵盖95_试题)一区两地一园一通道建设;人工智能时代的机遇与挑战.pdf VIP
- 2025商用车发动机气缸体铸件技术条件.docx VIP
- 颅内复杂动脉瘤介入治疗围术期护理专家共识2025 .pdf
- 第二节病虫害预测预报教学教材.ppt VIP
- 电梯新检规施工自检报告-曳引客货-2024.doc
- 2025年高考英语(新高考Ⅱ卷)试卷评析及2026高考备考策略 课件.pptx
- 2000年全国高中学生化学竞赛决赛(冬令营)理论试题与实验试题及参考答案精品.pdf VIP
- 苹果公司知识产权保护策略.pptx
- 中药饮片智能调剂与煎煮关键技术研究课件.pdf VIP
- 局部解剖学(山东联盟) 智慧树 知到答案.docx VIP
文档评论(0)