3、理性行为公理与效用函数.ppt

框架 理性行为公理与效用函数 决策表 决策函数 决策问题构成要素 ,为了表述决策问题 收益函数、损失函数和效用函数统称为决策函数——记作 f = F(a,θ) 收益矩阵、损失矩阵和效用矩阵统称为决策矩阵——记作 收益函数 把收益值作为决策方案的评价指标,最满意方案就是收益值最大的方案。 设决策问题的收益值为q,状态变量为θ,决策变量(方案或策略)为a。当决策变量a和状态变量θ确定后,收益值q随之确定。收益值q是a和θ的函数,称为收益函数,记作 q = Q ( a ,θ) 收益函数 如果决策变量和状态变量是离散的,即 a = ai ( i = 1 , 2 ,…, m ) θ=θj ( j = 1 , 2,…, n ) , 则收益函数可以表示为: qij = Q ( ai , θj ) ,( i = 1 , 2 ,…, m;j = 1 , 2,…, n ) 收益矩阵 损失函数 损失值又称为遗憾值(机会损失),表示没有采取最满意方案或策略时所造成的损失。 当决策变量a和状态变量θ确定后,损失值r是a和θ的函数,称为损失函数,记作 r = R ( a ,θ) 在离散情况下,损失值可以表示为 rij = R ( ai , θj ) ( i = 1 , 2 ,…, m;j = 1 , 2,…, n ) 损失函数 损失函数可以表示为损失矩阵,即 损失值可以

文档评论(0)

1亿VIP精品文档

相关文档