- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
时间序列数据挖掘在医疗领域应用
时间序列数据挖掘在医疗领域应用
摘 要:医院信息管理系统,不仅有利于提高了医务工作者的工作效率,同时也积累了大量的时间序列数据。时间序列数据挖掘技术对这些大量数据进行分析,会发现有用的、潜在的知识为开展高水平医学研究提供了有力的技术工具。对历史数据进行分析的同时能预测出未来的相关数据,为医院管理人员作出正确决策提供了依据。因此对医院信息系统中时间序列数据挖掘的过程以及所应用的技术深入研究,能充分发挥数据挖掘在医疗领域的作用。
??
关键词:时间序列;数据挖掘;医疗领域??
中图分类号:TP311.52 文献标识码:A 文章编号:1672-7800(2011)05-0123-02?お?
??
0 引言??
医院利用医院信息系统(Hospital Infmation System,HIS)进行管理,不仅提高了工作效率,而且会积累大量的时间序列的数据。时间序列中记录了信息系统各个时刻的所有重要信息。利用时间序列数据挖掘技术在庞大的数据中发掘有用的知识,充分利用这些知识,可以为广大患者提供更有效的服务;发现时间序列中对象演变的特征或对象变化的趋势,有利于管理者发现医院运作的基本规律,预测医院发展的趋势,合理、科学地规划医院的发展方向。??
1 时间序列数据挖掘??
时间序列数据挖掘(Time Series Data Mining, TSDM)就是从大量的时间序列数据中, 提取隐含在其中的、人们事先不知道的,与时间属性相关的、潜在有用的信息和知识的过程。研究内容包括相似性搜索、趋势分析、时间序列模式挖掘和周期模式挖掘数据。时间序列数据挖掘技术是一门综合性的技术领域,主要涉及数据库、人工智能、数理统计等众多领域的知识,属于复杂型的数据挖掘,对科技、人类社会的发展有重要意义。??
时间序列数据挖掘过程分4步进行:①确定挖掘对象:在这个步骤中要充分理解挖掘的应用领域,并确定研究问题的目标对象,熟悉解决问题的方法,理解相关领域的知识,确定数据挖掘结论的评估标准;②准备数据:选择适合挖掘、具有时间序列特征的数据,并将其搜集整理成一种统计数据。由于数据冗余性的特征,需要进行整理,清洗不完全的数据来削减数据。数据具有多样性要求对数据要采用相应的方法进行预处理,转换原始数据为数据挖掘所需的数据形式;③数据挖掘:对经过转换的数据选择合适的模型,确定训练与检验程序,建立模型与评估标准;④评估知识:对数据挖掘的结论进行解释,与研究目标进行比较。发现数据挖掘过程中可能存在的错误步骤,并且寻找解决方法;⑤知识的应用:在应用知识的过程中随时总结和发现实施过程中出现的问题,并解决问题,指导日后的实际应用。??
2 时间序列数据挖掘技术??
(1)时间序列预测法。时间序列预测法是将某种统计指标的数值,按时间先后顺序排列所形成的序列。对时间序列进行编制和分析,根据时间序列所反映出来的发展过程、趋势和方向,进行延伸或类推,借以预测下一段时间或以后若干年内可能达到的水平。分析时间序列的变化特征,建立以数学公式形式表示的预测模型对时间序列进行趋势分析或预测,利用模型推测未来状态。通常采用的模型有基于人工神经网络的时间序列预测模型、ARIMA模型、移动平均法、一元回归、灰色模型、指数平滑法等。任何一种模型对实际研究对象的简化和抽象,都会有局限性和不完备性,采用组合预测可以提供预测精度。目前多采用最优加权组合预测法,即利用多种预测方法,选取合适的权重系数经过加权平均得出组合预测模型。??
(2)时间序列相似性搜索。时间序列相似性搜索就是通常就是比较两个序列的时间多项式,找到两者之间的偏移量,再对比所采用的相似性度量,最后判断该两序列是否相似及其相似程度。该技术包括预处理和查询两个阶段。通过采用维数约简技术将高维的时间序列映射为低维空间上的特征表示,达到降低维数的目的;然后再进行查询比较。??
(3)时间序列模式挖掘。时间序列模式挖掘的研究对象主要是符号模式,目的是从时间序列数据库中找出频繁出现的子序列。采用Aprior算法可以利用候选模式产生机制来发现频繁的序列模式;使用投影树技术以及将原始数据库划分为特定模式的子数据库的方式来发现序列模式;将频繁序列分解成若干等价类,通过使用垂直的数据库方式来发现序列模式。??
(4)周期模式挖掘。以一组分片序列为持续时间的序列模式挖掘。??
3 在医疗领域的应用??
(1)DNA分析研究。运用相似性搜索法是从事DNA分析研究工作的主要手段。将从数据库中检索出的样本,构造出患者的基因序列组和健康组织的基因序列形成对照组,采用相似性搜索法对两者进行比较以识别出两类样本间的主要差异或找出每类中频繁出现的模式。分析得到的模式,在带病样
文档评论(0)