芯片和高通量测序数据分析简介.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
芯片和高通量测序数据分析简介;如何入门;一些基本概念;两个需要注意的地方;高通量测序数据分析流程;序列数据格式;序列数据格式;序列数据格式;SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。 head 行,以@开头,可以来存一些体现了比对的一些总体信息。 此后每一行为一个条序列。 第一列: read name,read的名字通常包括测序平台等信息 第二列:为flag的总和(整数)。 第三列:比对到参考序列上的染色体号。若是无法比对,则是* 第四列:比对到参考序列第一个碱基所在的位置。若是无法比对,则是0 第五列:比对的质量分数,越高说明该read比对的位置越唯一。 第六列:CIGAR值,碱基匹配上的碱基数。match/mismatch,insertion,deletion 对应字母 M、I、D 第七到第九列:双端测序的一些mate信息,没有的话以* 和0表示。 第十列:read的碱基序列,如果是比对到负链上则对read进行了反向互补。 第十一列:ASCII,read质量的ASCII编码。 第十二列之后:Optional fields,以tab建分割。 ;BAM格式:是SAM格式的二进制,所占的空间更小,更方便存储。BAM格式的文件可以直接在基因组浏览器上显示出来。 用samtools 软件可以对SAM, BAM 格式的文件进行处理,也可以实现SAM和BAM的相互转化。;常用数据格式BED;其他一些常用数据格式;Bowtie软件使用演示;GEO Dataset;GEO Dataset的使用;输入查询内容: miR-21 breast cancer;;实验的详细信息;;GEO Dataset的使用;;;;;网页中直接输出分析结果,可以查看探针号(ID), 变化倍数(logFC)p值,gene symbol,以及基因的说明,得到的结果可以粘贴到excel进一步分析;如何下载文献中的数据;文章提供的GSE号, 在GEO中输入这个序列号既可以查到数据;;SRA的原始测序数据下载;芯片数据分析的常用软件;Thank You !

文档评论(0)

pehalf + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7201060146000004

1亿VIP精品文档

相关文档