- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 对数转换 数据过滤 补缺失值 数据标准化 倍数法(Fold change) t检验法(t test) SAM (significance analysis of microarrays) 聚类的目的 对基因进行聚类 对样本进行聚类 基于物体的相似性将物体分成不同的组 样本 基因 基因表达谱 识别功能相关的基因 识别基因共表达模式 质量控制 检查样本是否按已知类别分组 发现亚型 距离尺度函数 欧式距离 Pearson相关系数 Spearman秩相关系数 互信息 聚类算法 层次聚类 Hierarchical Clustering 层次聚类算法将研究对象按照它们的相似性关系用树形图进行呈现,进行层次聚类时不需要预先设定类别个数,树状的聚类结构可以展示嵌套式的类别关系。 聚类算法 层次聚类 Hierarchical Clustering 2000年Alizadeh等运用基因芯片数据,基于层次聚类算法证实了DLBCL肿瘤病人在mRNA层面确实存在两种亚型 聚类算法 k-均值聚类 k-means Clustering k近邻分类法 k-nearest neighbour classification 决策树 Decision Tree Outlook Humidity Windy Play Sunny 75 False No Sunny 79 True No Overcast 60 False Yes Rainy 55 False Yes Rainy 75 False Yes Rainy 80 True No Overcast 80 True Yes Sunny 85 False No Sunny 50 False Yes Rainy 45 False Yes Sunny 40 True Yes Overcast 50 True Yes Overcast 55 False Yes Rainy 55 True No 决策树 分割准则 信息增益—— Information Gain 基尼指数—— Gini index 支持向量机 Support Vector Machines (SVM) 分类效能评价 构建训练集和检验集 n倍交叉验证(n-fold cross validation) Bootstrapping 无放回随机抽样 留一法交叉验证(leave-one-out cross validation,LOOCV) 分类效能评价 评价指标 真实 阳性 真实 阴性 预测 阳性 0 0 预测 阴性 10 90 ArrayTools DChip(DNA-Chip Analyzer) SAM Cluster和TreeView R语言和BioConductor: affy、marray、limma Matlab: Bioinformatics Toolbox Gene Ontology (GO) 目前应用最广泛的基因注释体系之一 基因及其产物知识的标准词汇体系 涵盖主要的动、植物和微生物基因组 生物学过程(biological process) 分子功能(molecular function) 细胞组分(cellular component) / Neurod6 神经源性分化因子 盒子里一共有N个球,其中红球n个,随机抽取m个球,其中有k个红球的概率? N k 随访资料 Gene 1 Gene 2 … Gene n Time Dead Sample 1 a11 a12 … a1n t1 1 Sample 2 a21 a22 … a2n t2 0 . . . . . . . . . . . . . . . . . . . . . Sample m am1 am2 … amn tm 1 “死亡”事件或失效事件 表示观察到随访对象出现了我们所规定的结局,是反映处理因素失败或失效的特征。 注意:失效事件应当由研究目的而定,并非一定是死亡,而死亡也并非一定是失败事件。 截尾值 有的观察对象终止随访不是由于失效事件发生,而是由于中途失访、死于其它原因、随访截止。 这些对象的观察值称为截尾值,常用符号“+”表示。如140+天。 生存时间 即随访观察持续的时间,按失效事件发生或失访前最后一次的随访时间记录,常用符号t表示。 某病人1990年2月1日进入随访,1992年4月间发生失效事件,他的生存时间为t=26月。 某白血病患者化疗3月后失去联系,他的随访结果为一截尾值,生存时间记为
您可能关注的文档
- 中原_华东与东北区营销总监第二梯队淡市营销启示培训_75p_2012年_课程_教程要点分析.ppt
- 中原_华东与东北区营销总监第二梯队经营意识与成本控制培训_22p_2012年课程要点分析.ppt
- 中原_蓝色思考之豪宅营销的客户运营视角_72...要点分析.ppt
- 中原_媒体营销策略培训_81p_课程_教程要点分析.ppt
- 中原_宁波开元_九龙湖畔开盘价格建议及销售执行策略_57要点分析.ppt
- 中原_深圳万科璞悦山深度踩盘报告_37p_2012年_高端住宅_建筑规划要点分析.ppt
- 中原_深圳新世界尖岗山项目市场汇报_40P_2012年_别墅_项目_量价走势要点分析.ppt
- 中原_深圳怡枫尚品项目开盘流程_开盘总结报告_80页要点分析.ppt
- 中原_深圳雍景湾踩盘报告_54P_2012年_产品_户型设计要点分析.ppt
- 中原_深圳招商地产蛇口海上世界海居项目定位沟通提案_58p_2012年_前期策划要点分析.ppt
文档评论(0)