- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机过程讲议
V1.0
2012年10月22日
目录
绪 论 1
第一章 随机数及其应用 2
第一节 随机数的生成 2
第二节 生物信息学中的随机策略 8
第二章 随机过程的概念与基本类型 11
第一节 随机过程的基本概念 11
第二节 随机过程的分布律和数字特征 12
第三节 几种重要的随机过程 17
第四节 泊松过程 21
第五节 布朗运动 28
第三章 马尔可夫链 32
第一节 马尔可夫链的概念 32
第二节 马尔可夫链的性质 37
第三节 马尔可夫链的生物信息学应用—PAM打分矩阵 42
第四节 马尔可夫链的生物信息学应用—判断CPG岛 51
第四章 隐马尔可夫模型(HMM) 55
第一节 隐马尔可夫模型的基本概念 55
第二节 隐马尔可夫模型中的三个基本问题 58
第三节 隐马尔可夫模型的生物信息学应用—CpG岛识别 66
绪 论
在实际的数据分析过程中,尽管横截面的数据可以反映一定的规律性,可以解释一些现象,但大多数情况下数据都是动态的,因为我们生活在时间的维度里。
因此为了更深入的了解随机现象,我们有必要引入时间的维度,开始研究随机过程。
随机过程是一门研究随机变量怎样随着时间参数而变化的一门科学。
注:(1)通常时间参数我们使用t。
(2)我们往往将随机过程分解为一族随机变量进行研究。
随机过程的作用:
随机过程有着十分重要的作用,它通过对过去数据的统计分析,发现一些规律;再通过现在的状态,进而预测将来的情况。
例如:天气预报、股票预测、微博点击量、服务器接收手机发的短信数、等等
随机过程在生物信息学中的应用:
随机过程在生物信息学中起着十分重要的作用,各个领域的经典算法不可避免的用到随机过程。其中比较重要的两个方面是马尔可夫链蒙特卡罗方法(MCMC)和隐马尔可夫模型。
例如:序列比对、蛋白结构预测、甲基化位点鉴别、模式分类、进化树、基因调控网络、拷贝数变异预测、药物靶点预测。
概率初步
具体内容参见 《概率论与数理统计》 和 《多元统计分析》
随机数及其应用
第一节 随机数的生成
随机数:随机变量的样本称为随机数。由于在统计上常用的是独立样本,因此不放假设随机数之间是独立的。生成随机数的方法称为随机数的取样法,英文sampling。
随机数在生物信息学中占有十分重要的地位,例如随机扰动网络、构建背景分布,多重检验校正中的permutation方法等等。一般在下一些结论的时候一个基本的逻辑是:看某种现象是不是随机的,如果不是随机的那么认为有一定的生物学意义,也正是我们要获得的结果。所有的这些过程都离不开随机数的使用。
1、产生随机数的一般方法介绍:
(1)手工法:是最早产生随机数的方法为即采用投掷骰子、摇号、抽签、摸球等办法,目前的彩票发行仍然采用此法。
(2)随机数表:随着一些随机模拟算法的发展,如蒙特卡罗方法(Monte-Carlo)等,需要大规模的随机数,这时手工已经不能满足计算的需要。1927年,Tippett制造了4万个随机数的表;1939年Kedell等用高速转盘生成了10万个随机数的表;后来兰德公司又用电子装置产生了100万个随机数。在计算机产生之前人民就利用这些方法产生的随机数进行统计计算。
(3)计算机存储法:在计算机发展的初期,人们只是扩展了随机数表法的简单应用,将随机数表刻在磁盘上,使用的时候将随机数调入内存,由于该方法存储随机数要占用较大的空间,随机数的长度也有限,目前已经很少用了。
(4)计算机物理法:在计算机上安装一台物理随机数发生器,将物理过程转成随机数。优点:得到的是真正的随机数,随机性和均匀性都很好,取之不尽用之不竭;缺点:有些学者做实验需要重复验证,物理法产生的随机数无法再产生一次相同的,另外随机数发生器需要经常检查和维修,因此这种方法也逐渐被取代。
(5)计算机数学法:使用数学算法,借助计算机来产生随机数。是目前使用最广、发展最快的方法。特点是占用内存少、速度快、可以生产两次相同的随机数便于重复性研究。
2、伪随机数
使用计算机,利用数学方法生成的随机数具体指的是按照一定的算法产生的数列,他们具有类似于随机变量的独立抽样序列的性质。但是由于这些数是由算法产生的,因而不可能是真正的随机数,我们通常把用数学方法产生的随机数称为伪随机数。正是由于伪随机数具有和真正的随机数相同的性质(如独立性等),我们就把伪随机数作为真正的随机数来使用。
伪随机数列:实际产生伪随机数的时候,往往利用某一递推产生数列,当充分大时,这一数列具有独立抽样序列的性质,我们成为伪随机数列。
随机种子:递推公式中的初值,我们称为随机种子。一旦随机种子确定,随机序列便可以确定。
3、随机数基本定理(要求掌握证明)
分布的随机数:设随机变量,我们称的随机
您可能关注的文档
最近下载
- 急性胰腺炎急救护理措施.pptx
- 老年人跌倒风险综合管理专家共识PPT.docx VIP
- 2024-2025学年高中音乐必修《歌唱》人音版(2019)教学设计合集.docx
- 人教版小学一年级数学上册期中试卷及答案(精品推荐)..doc VIP
- 2025云南大理白族自治州检验检测院(第二批)招聘编外聘用人员5人备考练习试题及答案解析.docx VIP
- FAN-045 37#地块 电梯井施工操作架搭设 及安全防护方案 终.doc VIP
- 《油气管道安全管理》课件.ppt VIP
- 高速铁路客运服务专业职业生涯规划书.pptx
- GJ B-360B-2009 电子及电气元件试验方法.pdf VIP
- 概率论与数理统计教程(第2版) 茆诗松全套PPT课件.ppt
原创力文档


文档评论(0)