- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
有关基因芯片数据写作方面的基本思路.pdf
有关芯片数据写作方面的基本思路
生物芯片北京国家工程研究中心微阵列服务部高级主任 张亮博士 2007 年5 月
随着生物芯片技术在广大科研工作人员研究工作中的应用,在写作论文的时
候,如何比较科学、直观地体现生物芯片实验的结果,是一些初步尝试利用芯片
数据来写作论文的科研工作人员希望了解的环节。现就笔者在生物芯片技术领域
积累的一些经验,做一个初步的总结。但由于生物技术发展很快,有很多内容可
能遗漏,还请读者能及时指出不足之处。
1.挑选差异表达的基因
利用生物芯片进行研究的第一步,往往是要找到差异表达的基因。选择差异
表达的基因,笔者建议采用生物芯片为科研工具的研究人员使用 SAM 软件
(Significant Analysis of Microarray),它是由Standford 大学开发的一个免费软件,
目前广泛地被学术界所采用,进行挑选差异基因。SAM 软件可以作为插件在
Office Excel 软件中进行应用,很容易被生物医学工作者掌握。SAM 软件进行分
析的一个基本前提就是需要至少 3 次实验以上的重复。这里的重复可以是生物材
料的重复,例如某种疾病包含多个病人;也可以是实验的重复,例如药物处理细
胞做了 4 次实验。通过重复实验,才能从统计学意义上判断差异变化的基因。可
以理解 SAM 软件和统计学 t-test 检验有类似之处。笔者从合作单位被编辑退回
的稿件中了解到,有很多退稿是因为没有进行重复实验,例如对照和处理各一个
样本,然后认为荧光信号值差异在 2 倍以上的基因就是差异的基因。审稿编辑的
意见往往是需要加上重复实验进行统计分析。
举一个例子,要研究某种疾病 A 的人群和疾病 B 的人群血液中有核细胞基
因表达的差异(疾病A 和疾病 B 人群分别至少要有 3 个人以上)。若是使用了单
通道的表达谱芯片,例如 Affymetrix 的芯片,你可能得到例如表 1 这样的数据:
表 1. 单通道芯片设计的例子(以信号值进行计算)
1
样 本 病 A1 病 A2 病 A3 … 病 B 1 病 B 2 病 B 3…
基因
NM_001192 122 453 278 1345 2315 1954
NM_004836 4566 3567 5632 5643 5689 6112
AK025431 11831 13432 12543 24231 21998 19888
在 SAM 软件进行差异基因筛选的时候,这种例子可以选择two class unpaired
(2 因素不配对)的算法。因为实验研究的就是2 组样本,并且疾病 A 和疾病 B
的病人之间没有一一配对的关系。那么在进行 SAM 软件运算前,需要加一行样
本识别标记(可参见表 2 ),让 SAM 程序知道哪些信号值是来自同一组病人的。
表 2. 单通道芯片数据在 SAM 软件中的格式
样 本 病 A1 病 A2 病 A3 … 病 B 1 病 B 2 病 B 3…
基因
1 1 1 … … 2 2 2
NM_001192 122 453 278 1345 2315 1954
NM_004836 4566 3567 5632 5643 5689 6112
AK025431 11831 13432 12543 24231 21998 19888
另外加入的一行蓝色字体就是样本识别标记,这样 SAM 软件通过格式上的默认,
就知道哪些数据是同一组病人的不同重复。目前发现单通道芯片有这样一种可能
的缺陷:若一个实验进行的时间很长,例如 1-2 年以上,那么进行芯片实验的试
文档评论(0)