对医学信息大数据趋势下医学统计学教学论文.docVIP

对医学信息大数据趋势下医学统计学教学论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对医学信息大数据趋势下医学统计学教学论文      随着医学健康档案“电子化、信息化、数字化、智能化”的管理和医学研究资料的不断积累医学信息大数据时代悄然开启如何有效地利用这些海量信息为健康管理和健康决策提供支持本文分析了大数据对统计学原理和方法提出的挑战列出了在医学统计学课程教学中应该思考的一些问题      所谓大数据(BigData)是指具有4V特征且用目前的管理、处理技术手段难以进行有效管理和分析的数据4V的含义是数据量大(VolumeBig)数据量级扩大至PB以及ZB级别;数据产生、输入和处理快速化(VelocityFast);数据结构和类型多样化(VariableType)及数据价值密度低(ValueLowDensity)大数据的目的是将数据转化为知识探索数据的产生机制和过程进行预测和政策制定随着医学健康档案“电子化、信息化、数字化、智能化”的管理随着物联网在医学健康领域的应用医疗、护理、康复、保健工作流程中产生的数据存储量呈指数增长如何有效地利用这些海量信息为健康管理、临床治疗、医院决策及卫生政策制定提供支持是大数据时代医学信息化带来的挑战美国国家卫生研究院(NIH)为此特设立生物医学大数据研究中心及专项基金在我国科技部、国家自然科学基金委、国家社会科学基金委陆续酝酿和启动了“大数据的处理与应用”系列重大研究项目      统计是一门数据科学医学统计学是关于医学健康数据的收集、整理、分析和解释的方法论学科“大数据”处理对统计学的发展提出了新的命题如何将“医学信息大数据”处理技术融入相关统计学课程教学以促进现代医学信息分析技术的发展?本文做了相关的分析并提出应该思考的一些问题      一、大数据对统计学原理和方法提出的挑战      1.统计数据产生由“问题导向”到“数据驱动”      目前统计数据的产生主要是基于所要研究的问题而主动进行的“数据收集”落脚点在于如何获取数据在大数据时代海量数据随处可得由数据驱动而进行问题研究将非常普遍那么获得数据的关键点不在于如何获得而在于如何识别与选择由“问题导向”产生的结构数据是经过严格抽样设计获取的具有系统误差小、总体代表性好的优势但是信息量有限且数据获取周期长大数据流环境下海量数据中有价值的数据可能并不多即数据的价值密度低且难以避免和判断数据获取的误差和偏倚在很多情况下统计数据不需进行抽取而是“数据样本即总体”;同时也要研究如何从源源不断的数据中抽取足以满足统计目的和精度的样本这需要研究新的序贯性和动态性的抽样方法      2.数据格式和结构复杂多样化      目前统计数据都是结构化数据如疾病空间分布和时间序列数据等可使用二维表格表示可以方便地被常规统计软件读取和进行分析在大数据背景下除少量数据具有结构化特征外更多的是半结构和非结构化数据如各种格式的文档、图片、网页、图像、音频和视频等目前这些半结构和非结构化的大数据仅能做到初步的实时业务应用如在研究气候变化与人类健康相关的命题时需要处理庞大的气象数据而80%以上的气象数据均为非结构化的大数据如何将这些非结构化的大数据做到降维、分解和长时间序列储存无疑是统计学面临的新命题      3.大数据的整合及跨库分析方法亟待建立      传统上数据集的合并和拆分都是利用关系数据库技术如共同的编码或关键字进行操作在大数据环境很多数据集不再有标识个体的关键字关系数据库链接方法不再适用需要探讨利用数据库之间的重叠项目来结合不用的数据库此外还可以改变分析思路如直接利用局部数据进行推断然后整合这些数据集的统计结论      4.大数据对于统计学核心理论的冲击      一个新生事物的出现将必定导致传统理论和技术的变革大数据对传统统计学原理和方法的冲击是划时代的传统的统计学方法和理论立足于应用抽样技术在总体中抽取小样本进行分析通过样本统计量推断总体的参数和性质在大数据背景下我们更关心的不是数据量的大小而是数据所蕴含的信息量及信息的识别和选择因此大数据的预处理如数据清洗、纠偏完全跳出了传统小样本研究的范畴同时大数据充满了各种随机的、非随机的误差和偏倚很难满足小样本数据精度和分布的要求在大数据时代需要进一步拓展统计思维丰富现有统计学的理论和方法赋予统计学新的生命力      二、在大数据时代对统计学教学的几点思考      《“十二五”时期统计发展和改革规划纲要》中明确提出“建立现代统计体系就是建立以现代信息技术为支撑的统计系统”根据这个纲要计算机技术、互联网系统、多媒体等现代信息技术在统计技术中将发挥更重要的作用在医学信息大数据时代背景下医学统计学教育是否能够与时俱进迎接大数据带来的机遇与挑战?为此笔者谈几点思考:      1.补充和加强数学基础和计算机应用课程      在大数据背景的冲击下统计学教育

文档评论(0)

scj1122118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8066052137000004

1亿VIP精品文档

相关文档