半Markov切换空间控制过程和其应用.pdf

摘要 础上,提出了基于单样本轨道的在线自适应策略迭代算法,证明了算法的收敛 性。对于随机型策略的优化,在性能梯度公式的基础上,结合性能势基于单样本 轨道的表示形式,推导出平均性能测度关于事件驱动的切换控制策略的性能梯 度基于单样本轨道的估计式,进而结合随机逼近算法,提出了基于策略梯度的在 线自适应优化算法。利用事件驱动的策略特性,有效减小优化算法的计算量,摆 脱对系统参数的依赖,提高算法的自适应性。系统的层次化动态结构使得基于梯 度的算法能够收敛到全局最优。 研究无线多媒体通信网的适应带宽配置,通过构建事件驱动的随机分析模 型,将适应带宽配置问题转化为一个带约束的随机优化问题。在模型中,适应带 宽配置和呼叫准入控制构成一个统一整体,考虑了各类业务的不同优先级,区分 了新到达呼叫与越区切换呼叫。考虑三种重要的QoS指标作为约束,提出一种 结合策略梯度估计和随机逼近的在线自适应优化算法。该算法充分利用事件驱 动的策略特性,计算和评估只需在事件发生的时刻进行,并且不依赖于系统参数 的信息,对环境的变化具有良好的适应性,能够保证收敛到全局最优值,有效求 解多种QoS指标约束下的适应带宽配置问题。 考虑动态电源管理的随机型策略和超时策略的优化问题,构建事件驱动的 半Marko

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档