- 10
- 0
- 约6.45万字
- 约 54页
- 2015-10-19 发布于贵州
- 举报
erlan(k)bandit抽样过程
摘要
本文研究的对象是Bandit抽样过程,它包括两个基本模型:Bandit
过程进行了研究,如BernoulliBandit抽样过程和负指数Bandit抽样
过程。本文在Gittins的基础上,利用动态规划向后归纳方法和贝叶
斯方法,研究了目前在实际中应用更广泛的Bandit抽样过程。
本文的主要研究内容如下:
一、对几类特殊Bandit抽样过程的参数的后验分布、抽样值的条
件分布和抽样报酬函数等进行了计算,讨论了它们的单调性质。
程的最优决策问题,构造了计算描述最优选择的平衡值序列的算法,
并研究了过程Gittins指数和平衡值序列的渐近性质,这有效解决了
充和推广。
程的最优决策问题,提出了计算描述最优选择的平衡值序列的算法。
将Bandit目标过程基于的分布从负指数分布推广至Erlang(2)分布,
是对Bandit目标过程的补充和推广。
四、到目前为止,大多数研究Bandit过程的文献没有考虑抽样时
间间隔,均假设一致折扣或几何折扣,并不符合某些实际情况。本文
对考虑实时折扣,抽样时间间隔服从负指数分布,抽样值服从Erlang(2)
分布,允许在任意时刻跳转的Bandit报酬过程进行推导和计算,讨论
了过程Gittins指数的单调性质,构造了
您可能关注的文档
- a-单调性其在非线性变分包含与集值变分包含组中的运用.pdf
- adomin分解方法及其最新进展.pdf
- ad ho网络模型下的边不相交路径选择算法.pdf
- ads&l;'n>空间中的lorentzian超曲面.pdf
- ahp及其大学生培养成本模型中的应用.pdf
- ahp理论关于判断矩阵一致性问题研究.pdf
- akns方族相关的新的全离散可积系统.pdf
- ample范丛的seshadri常数.pdf
- amenale群作用动力系统的拓扑条件熵和自共形测度发散点的维数.pdf
- an ismorphism between two left-symmetric algebra a structures.pdf
最近下载
- 焦炉烘炉过程中常见问题分析及对策.doc VIP
- 2026年怒江供电局项目制用工招聘(20人)笔试备考题库及答案解析.docx VIP
- 邮储个人网上银行客户操作手册.pdf VIP
- 数字林业-技术对林业增长的影响.pptx VIP
- 07B【沪教牛津版英语字帖】七年级下册单词表国标手写斜体字帖(含音标上海教育出版社).pdf VIP
- 浙江省绍兴市上虞区2024-2025学年六年级上学期期末考试科学试题(含答案).docx VIP
- 学堂在线审美的历程章节测试答案.docx VIP
- 湖南省湘潭市湘乡望春中学2018-2019学年高一数学理下学期期末试题.docx VIP
- 小学春季学期英语学科教学质量检测与评估测试聚焦2.pdf VIP
- 小学英语教学法 教程教案.pdf VIP
原创力文档

文档评论(0)