- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Hadoop的医疗辅助诊断系统的设计与实现-计算机科学与技术专业论文
东华大学学位论文版权使用授权书
学位论文作者完全了解学校有关保留、使用学位论文的规 定,同意学校保留并向国家有关部门或机构送交论文的复印件 和电子版,允许论文被查阅或借阅。本人授权东华大学可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以 采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保密 □,在 年解密后适用本版权书。 本学位论文属于
不保密 □。
学位论文作者签名: 指导教师签名:
日期: 年 月 日 日期: 年 月 日
基于 Hadoop 的医疗辅助诊断系统的设计与实现
摘要
我国医院大范围建设以电子病历为重点的信息系统已进行了 10 多年。电子病历、实验室信息系统、医学影像传输和存储系统等信息 系统已被引入到医院中,这使得医院积累了丰富的医疗数据资源。以 上海交通大学医学院附属瑞金医院为例,每年产生的临床数据约在 60TB。医疗数据包括了临床诊断、检验检查结果等类型,具有数据量 大、数据形式多元、数据变化快、数据价值高的“大数据”特征。如 何利用这些数据为临床医疗诊断提供数据支持、让医生更好地为病人 服务,是信息化建设的更高要求。
论文结合《基于瑞金医院的临床大数据平台建设和深度应用》实 际项目,研究了基于大数据处理平台 Hadoop 的医疗辅助诊断系统。 首先分析了医疗数据的特点,综述了数据挖掘相关技术。针对糖尿病 人处方数据,研究了基于关联规则的药品推荐,并通过改进算法提高 效率满足了医疗诊断的及时性要求。针对甲亢病人的检验数据,研究 了基于逻辑回归的并发症预测,结合医疗数据特点,分析了数据清洗、 集成、转换以及预测结果的评估相关技术。使用 MapReduce 和 Spark 两种计算模型,论文对医疗辅助诊断系统的药品推荐和并发症预测功 能进行了实现,验证了课题研究方法和技术的有效性。论文的主要工 作有以下几个方面。
i
(1)研究了基于关联规则的药物推荐。利用数据挖掘中的关联
规则算法,找出医疗处方数据中的频繁处方项集,并从频繁处方项集 中寻找有意义的处方关联信息,在医生开具处方时提供辅助诊断作用。 为了满足药品推荐的及时性需求,论文对关联规则的经典 Apriori 算 法进行改进,提出基于前缀项集的 Apriori 算法,并在实际医疗处方 数据上证明了改进算法的有效性。
(2)研究了基于逻辑回归的并发症预测。针对病人的各种检验 指标数据,结合数据挖掘中的逻辑回归算法建立分类模型,通过该模 型对未来病人的患病情况进行判断,从而达到为医生提供辅助诊断的 效果。在预测功能具体实现中,本文使用了 1~99 分位极值处理、基 于熵的数值离散化、针对不平衡数据的模型评估方法等技术以保证最 终预测模型的准确性。
(3)在 Hadoop 平台上使用 MapReduce 计算模型,实现了药品推 荐功能,并通过实验比较分析了经典和改进的 Apriori 算法的性能, 验证了改进算法的有效性;使用 Spark 计算模型,实现了并发症预测 功能,并以原发性甲状腺机能亢进症病症为例,详细分析了功能的实 现过程,给出了预测结果。
关键字:医疗大数据,医疗辅助诊断,关联规则,逻辑回归,Hadoop
ii
DESIGN AND IMPLEMENTATION OF MEDICAL DIAGNOSIS AIDED SYSTEM BASED ON HADOOP
ABSTRACT
The information system of electronic medical records has been carried out for 10 years. Electronic medical records, laboratory information system, medical image transmission and storage system and other information systems have been introduced into the hospital, which makes the hospital has accumulated a wealth of medical data resources. Taking the Ruijin Hospital Affiliated to Shanghai Jiaotong University School of Medicine as an example, the clinical data emerged is about 60 TB every year. Medical data including clinical diagnosis, test results and other types, has the
您可能关注的文档
- 基于H.264的嵌入式视频监控系统设计-软件工程专业论文.docx
- 基于H.264的感兴趣区域视频编码研究-通信与信息系统专业论文.docx
- 基于H.264的网络视频传输系统的设计与实现-通信与信息系统专业论文.docx
- 基于H.264的视频压缩技术及其在网络视频监控系统中的应用研究-通信与信息系统专业论文.docx
- 基于H.264的视频压缩算法研究-控制理论与控制工程专业论文.docx
- 基于H.264的变换编码和熵编码的研究生物医学工程专业论文.docx
- 基于H.264的无线视频采集系统-软件工程专业论文.docx
- 基于H.264的视频监控系统设计与实现-计算机系统结构专业论文.docx
- 基于H.264的远程视频监控系统的设计与实现-信号与信息处理专业论文.docx
- 基于H.264的运动估计搜索算法研究-计算机应用技术专业论文.docx
- 基于Hadoop的协同过滤推荐算法的设计与实现-软件工程专业论文.docx
- 基于Hadoop的分布式视频大数据前景检测与运动跟踪方法分析-软件工程专业论文.docx
- 基于Hadoop的地理实体对象化存储方法研究-测绘工程专业论文.docx
- 基于Hadoop的在线存储系统的设计与实现-软件工程专业论文.docx
- 基于Hadoop的双语语料采集系统-计算机科学与技术专业论文.docx
- 基于Hadoop的合理用药系统设计与实现-软件工程专业论文.docx
- 基于hadoop的分布式详单查询系统设计与实现-软件工程专业论文.docx
- 基于Hadoop的作业调度负载均衡算法研究-计算机科学与技术专业论文.docx
- 基于Hadoop的多版本栅格地图存储与管理系统-计算机技术专业论文.docx
- 基于Hadoop的外观专利图像检索系统的研究与实现-信号与信息处理专业论文.docx
文档评论(0)