基于客户端的学习算法节能问题.pdfVIP

下载本文档

0
0
约1.8万字
约 24页
2021-07-19 发布于广东
举报
版权申诉

基于客户端的学习算法节能问题.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

深圳大学本科毕业论文（设计）诚信声明本人郑重声明：所呈交的毕业论文（设计），题目《基于客户端的学习算法节能问题》是本人在指导教师的指导下，独立进行研究工作所取得的成果。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式注明。除此之外，本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。本人完全意识到本声明的法律结果。目录摘要 (关键词)1 1．引言1 1．1 选题意义 1 1．2 国内外发展状况 1 1．3 展望 2 1．4 目前强化学习遇到的问题2 1．5 研究方法的探索 3 2．系统模型及理论支持3 2．1 马尔科夫决策过程 3 2．2 强化学 3 2．3 Q 学 4 2．4 Q 学习的信道选择算法 5 2．5 Boltzmann 学习规则 6 2．6 模拟退火过程7 2．7 OFDM 的信道接入方式 7 2．8 系统模型7 2．9 蒙特卡洛方法8 3．算法流程及实验过程8 3．1 实验过程 8 3．2 算法流程 8 3．3 仿真过程 10 4．结果分析11 4．1 数据分析 11 4．2 实验中存在的问题和可行性 13 5．结束语13 6．参考文献13 7．致谢14 abstract(key words)15 基于客户端的学习算法节能问题信息工程学院电子工程系（集成电路设计与集成系统）蔡凯钊学号：2014130254 【摘要】如今移动客户端数量日益增多，通信频道资源渐渐难以满足需求，本文采用一种基于 Q 学习的信道选择算法，通过建立点对点用户之间的通信信道模型，并且建立一个合理的回报函数，使得智能机能够通过总结经验来改善行为决策，进而使得最终可以得到最优的选择决策。由仿真结果可以得出，该算法可以有效的提高用户接入信道的平均信道容量，由于信道的平均容量得到了提升，信息在该系统下的信息传递速率也会有一定的优化，从而达到充分利用优秀信道资源，节约信道资源的效果。【关键词】信道选择；Q 学习；节能问题 1．引言 1.1 选题意义人工智能是现今最热门的研究领域之一，其中研究人工智能的核心方法就有机器学习。最初是希望计算机拥有一定的自我学习能力，从而可以自我获取知识、提高智能性。随着机器学习领域的不断探索，将人类的学习能力赋予机器已经不再是机器学习的主要目标了，研究目标转向了可以有效地由计算机实习数据分析技术。然而机器学习需要采集大量的环境反馈，累积奖赏值，从而获得最优决策，这一过程需要大量的数据采集、分配和计算，对于计算机的能耗有着较大的要求。为了节约能耗，我们需要通过强化学习，优化算法结构和效率，从而用更少的能耗找到最优决策，这样可以减少对硬件的要求，将机器学习推广到更多领域中。强化学习，是机器学习领域中一种重要的学习方法，强化学习的应用烦恼为涵盖了智能控制、机器人及分析预测等众多领域。在无线通信领域中，无线资源的需求日益增加，如何高效有序的将信道频谱资源进行分配，也是节约能耗的一个关键问题。本文通过强化学习的方法来对频谱接入，和信道分配进行动态规划，目的是为了合理运用现有资源，充分改善资源利用率，为实现动态频谱管理，和减少频谱资源需求，提供了一定的实践基础。 1.2 国内外发展状况国内外对于强化学习都有众多的研究成果和应用实例，目前发展应用较多的几个方面有：在调度管理中的应用：调度问题是一种随即优化控制问题的实际例子，解决这种问题将会带来很高的经济价值。比如，Crites 和 Barto 就把强化学习算法应用到楼层电梯系统中。通过强化学习算法，采集记录乘客的位置和目标楼层，动态规划电梯的行径，其效率远远超过了一般的动态规划。另外，强化学习的应用例子还有很多，如，在蜂窝电话系统中动态信道分配及机器调度问题。在机器人技术中的应用：机器人研究领域是强化学习最适合，也是应用实例最多一个领域。近年来国际上兴起了将强化学习应用