马尔科夫决策.ppt

马尔科夫决策

第一节 基本原理 一、基本概念 1.随机变量 、 随机函数与随机过程 一变量x,能随机地取数据(但不能准确地预言它取何值),而对于每一个数值或某一个范围内的值有一定的概率,那么称x为随机变量。 假定随机变量的可能值xi发生概率为Pi 即P(x = xi) = Pi 对于xi的所有n个可能值,有离散型随机变量分布 列: ∑Pi = 1 对于连续型随机变量,有 ∫P(x)dx = 1 在试验过程中,随机变量可能随某一参数(不一定是时间)的变化而变化. 如测量大气中空气温度变化x = x(h),随高度变化。这种随参变量而变化的随机变量称为随机函数。而以时间t作参变量的随机函数称为随机过程。 也就是说:随机过程是这样一个函数,在每次试验结果中,它以一定的概率取某一个确定的,但预先未知的时间函数。 2、马尔科夫过程 随机过程中,有一类具有“无后效性性质”,即当随机过程在某一时刻to所处的状态已知的条件下,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档