- 1、本文档共29页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据驱动建模:奇异值分解与主成分分析data-driven modeling: singular value decomposition (SVD) and principal component analysis (PCA) “Omics”: 海量数据 microarray: 在N个样本中 同时监测M个基因的表达水平 数据量: M x N 未考虑关于N个基因的背景知识 问题 如何刻画数据的主要变化趋势? 个别基因与主要趋势如何联系? 如何用“最少数量” 的独立参数(最少的假设),来代表数据中“有意义”的信息? 复习 线性组合、线形空间 向量的内积,正交 向量、基矢量 线性变换与矩阵乘法 SVD 是什么? 考虑 M x N 的矩阵 A 数据压缩与数据过滤 example 奇异值分解与几何变换:A的“大小”(范数) 奇异值分解与线形方程组 例子:代谢流量平衡 线性最小二乘拟合 Back to gene expression data 含义? 例子:出芽酵母细胞周期基因表达数据驱动建模 (PNAS,2000,10102) SVD SVD-original data 最大奇异值 〉90%的表达水平 SVD-original data data normalization by SVD SVD-filtered data expand to real genes/real mechanisms Sorting the genes 主成分分析(principal component analysis,PCA) PCA 2、协方差矩阵对角化 PCA 3、本征值排序 PCA变换的性质 数据分析中的应用 数据投影(可视化)/聚类 320 genes, 7 samples * 假设: k种相互独立的调控机制,其相对贡献:?j 对每个基因的影响: Uj (有M个分量) 对每个实验条件的影响:Vj (有N个分量) N 组(不同条件下)近似观察结果: ?与每组观察结果对应的体系状态参数 小的奇异值代表误差 x b=Ax 奇异值为零和不为零的U(V)向量将M(N)维线性空间分为U0(V0)和U1(V1) 两个互相正交的子空间。 V0: A 的零空间 U1: A 的定义域 可能的稳态流量是零空间的向量 理想模型 实际观察 误差最小的结果 在N个样本中 同时监测M个基因的表达水平 数据量: M x N? 基因表达矩阵 M 个基因的表达水平不一定是相互独立的 N 个样本不一定是相互独立的 基因和样本之间是如何关联的? uj: “eigengene” vj: “eigen expression” “eigengene” j is only expressed in the jth “eigenarray” with expression level ?j 假设所有观察数据受到 k 种互相独立的调控机制的影响。 每种调控机制对各个基因表达的影响: uj uj系数: 相对强度和相位 (对基因归一化) 不同调控机制对表达数据的贡献:?j 每种调控机制对各个样本的贡献:vj vj的系数:相对强度和相位 (对样本归一化) 390 min /30 min ( 14 samples) 6109 open reading frames (ORFs), 5981 genes with complete data 表达数据: 5981x 14 time invariant ( vj constant ) 表明: 样本是在稳态基础上的小的变化 The second, third, and fourth eigengenes, which show oscillations during the cell cycle, capture about 3%, 1%, and 0.5% of the overall relative expression, respectively. SVD-filter 2 filter 1 eigenarray, eigengene ? regulatory mechanisms 14 samples ? correlations with two eigenarrays 高维数据--〉低维数据 N组观察数据 每组观察M个变量 (数据是M维的) 希望用LM个变量来代替原来的数据 1、计算M 个变量间的协方差矩阵 4、 变量替换 1、 新的数据分量是正交的 2、如果保留全部非零本征值,总协方差不变 每个基因: 多个样本表达数据 (N) (M) 样本之间的协方差矩阵
您可能关注的文档
最近下载
- 最新版设备URS模板.docx VIP
- 《疼痛管理-基础理论篇》智慧树知到课后章节答案2023年下中国人民解放军总医院第四医学中心.docx VIP
- 机械企业重大事故隐患判定标准(图文并茂版).pdf
- 2025全国中小学“学宪法、讲宪法”知识竞赛题库(含答案).docx VIP
- 《继发性高血压》课件.pptx VIP
- 在线网课学习课堂《高级医学英语(首都医大 )》单元测试考核答案.pdf VIP
- 物品分类与名称标准化方案物业管理处仓库物品盘点方案.docx VIP
- (2025年)全国中小学“学宪法、讲宪法”知识竞赛题库(含答案).docx VIP
- 业务循环内部控制及测试工作底稿(内控审计全).doc.docx VIP
- 1000kVGIS(HGIS)接地设计方案.pdf VIP
文档评论(0)