中国和加拿大合作出生队列研究数据统一及共享方法-中国医药生物技术.PDF

中国和加拿大合作出生队列研究数据统一及共享方法-中国医药生物技术.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国和加拿大合作出生队列研究数据统一及共享方法-中国医药生物技术

494 中国医药生物技术 2015 年 12 月第 10 卷第 6 期 Chin Med Biotechnol, December 2015, Vol. 10, No. 6 DOI: 10.3969/j.issn.1673-713X.2015.06.004 ·生物样本库建设· 中国和加拿大合作出生队列研究数据统一 及共享方法 周光迪,吴美琴,赵丽,吴宇航,翁鑫宇,蒋聪,赵莎莎,王伟业 出生缺陷、代谢综合征、儿童孤独症、多动症、哮喘、 environmental chemicals,MIREC )出生队列。其中 SBC 计 糖尿病、不孕不育、肥胖、心脑血管疾病等多种疾病都与胎 划招募 4000 位孕妇,3D 和 MIREC 计划招募 2000 和 儿期的环境暴露关系密切[1-2] ,所以出生队列研究等针对生 2500 位孕妇。三个队列的研究方向各有不同,其共同焦点 命早期环境暴露的研究近年来迅速发展,对病因学研究有着 是探索环境因素影响胎儿在母体子宫内发育及出生后发育 关键的推动作用。大样本量对于统计结果准确性的提升至关 生长至成人阶段可能出现的不良影响。在三个队列分别进行 重要,单个项目常因资源不足而影响统计分析,而大型队列 了一段时间后,中加双方才开始接洽队列信息共享的工作, 项目所需的资源量从时间、人力和物力方面难以实现,这样 所以本项目需要整合三个队列的数据资源,但已经存在的数 的矛盾直接影响了基于队列数据的后续研究[3] 。因此,非常 据存在异质性而无法直接整合。三方的变量选择、定义、标 有必要整合不同队列之间的信息,并进行共享,来解决大样 准都有巨大差异,已经不可能统一标准收集数据或直接统一 [4] 本量和大资源消耗量之间的矛盾 。 数据集,所以将首先同质化三个队列项目的数据,再进行数 项目资源之间的信息统一(data harmonization )与共享 据共享。像中加出生队列项目这样各方先收集数据、再接洽 (data sharing )在国际上已经开展多年,最显著的例子是生 整合数据资源的情况普遍存在,但缺少数据同质化和整合的 物医学资源整合机构 BBMRI 采用分布式中心(distributed 模式和方法。队列项目,尤其是跨国的队列项目之间的数据 hub )的模式,将样本和数据存储于分布式中心,由虚拟的 资源整合,往往面对多重的伦理法规限制,各方的数据统一 中心用联邦制方式管理数据[5] 。目前,国内资源共享的项目 后也不一定能够整合。中加出生队列项目在实现三个队列研 尚缺乏经验和模式。信息共享模式主要有三种,第一种为直 究数据共享、为病因学研究提供大数据分析结果的同时,更 接集中数据,将各中心数据直接集中在一起,统一管理、分 能为类似情况的国际数据共享合作项目提供模式和方法上 析、利用。优点是标准统一、便于大数据整合,缺点是可变 的重要参考,并为如何在符合国际伦理规范的前提下进行跨 性小,可行性低。因为各研究中心往往有不同的研究偏向, 国数据共享树立范例。 不同的具体条件,不同的知情同意与伦理法规。在这样的前 提下,强行统一变量的选择和数据标准并不现实,几乎无法 1 方法 实施。第二种共享模式为通过最小数据集,即不同项目按相 1.1 制定数据词典 同的定义和标准来收集共同的最核心数据,用这些核心数据 数据词典定义数据流图中的各个成分的具体含义,对数 来代表研究群体的特性,并在项目之间共

文档评论(0)

wumanduo11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档