- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
计算力学是一个全新的理论框架,主要研究动力学系统中的几何状态空间
Fe研究所的Crutchfield教授从80年代开始从事
如何支持符号推理计算。Santa
这方面的工作。£机是计算力学体系中的主要理论工具,它的目标在于用尽可能
少的人为假设,去揭示系统隐含的固有模式。因此,本文称£机是一个模式发现
的理论。
揭示系统隐含的模式或结构是复杂性研究的重要途径,在£机理论中,称之
为因果态重构。目前,最重要的£机重构算法是Shalizi在2004年给出的因果态
分割重构(CSSR)算法。CSSR算法分为3步:初始化、齐次化、确定化,它
以概率统计(如条件概率、KS检验)为工具,能够从平稳的符号序列中推理出
系统的因果态。每个因果态都由一系列字符串组成,它们具有相同的变体——
条件概率分布。
£机是复杂性研究中一个颇有价值但十分晦涩的理论,把它引入到工程研究
中,是一项有意义的挑战。本文首先从£机理论抽象出模式发现的思想,并把它
同两个不同的问题——异常检测和强化学习相结合,给出了一系列新颖的算法
和有意义的结论。其中,异常检测算法更多的表达了“模式”的思想,而强化
学习算法更多的体现了“发现”的过程。多个实例分析证明了算法的有效性,
同时也证明了£机理论的客观性和普遍性。我们的工作主要体现在以下一些方
面。
: 异常检测算法包含一个重要假设:系统的特性演变非常缓慢,且体现在时
问序列非平稳变化中。它包含两个重要步骤:时问序列的符号化;建立结构向
量模型。
CSSR算法只适用用于符号序列,但多数时间序列都是实数的,因此,符号
化处理是必需的。统计复杂性是基于£机的全新的信息测度,可以作为符号化方
法的判断标准。本文从多个不同领域选择了8组时间序列作为研究对象,用不
同的方法作符号化处理,计算并比较它们的统计复杂性,得到了一系列经验结
论。
把系统响应的时间序列做符号化处理,用CSSR算法重构出系统的因果态集
浙江大学博士论文;复杂系统的模式发现
合,把它们写成结构向量的形式,每个因果态对应向量的一维。结构向量是系
统特性的表达式,它可以刻画系统内部两种不同性质的演变:一是因果态内部
的变化:二是因果态的出现或消失。前者是一种量的变化,后者更倾向于质变。
在结构向量的基础上定义异常测度,描绘系统的异常演变曲线,因果态的出现
或消失会导致曲线的大幅跳跃。这种跃变可以作为系统出现危险的预警信号,
它可以在一定程度上取代人为定义的阈值。3个实例:Duffing振子、疲劳断裂、
振动时效从不同侧面证明了算法的有效性。
半观测马尔可夫决策过程(POMDP)是一个经典的强化学习问题。如果从£
机的角度来分析它,把POMDP问题转变成全观测MDP问题的过程就是一个模
式发现的过程。POMDP中的隐含状态同£机理论中的因果态具有对应关系。为
此,在CSSR算法的基础上,提出了隐含状态分割重构(HSSR)算法。在HSSR
算法中,观测字符串的变体定义为它周围的观测,并用自定义的齐次性检验取
它在迷宫中所处的位置。
HSSR算法纠正了状态扭曲的问题,把它同Q学习相结合就组成了完整的强
化学习算法HSSR—Q。两者的融合存在关键障碍:如何保存并使用Q值。在
HSSR-Q算法中,由字符串负责保存并更新Q值,字符串的Q值加权平均得到隐
含态的Q值,Agent根据隐含态的9值来做出决策。HSSR—Q算法实现了隐含状
态揭示和动作策略学习的同步进行,并收到了较好的效果。
本文全面而系统的介绍了£机理论,并把这项复杂系统的研究成果同工程实
践紧密结合,做了多方面的研究,得到了全新的算法和结论,同时也体现了£机
理论的工程价值。
关键词:复杂系统;模式发现:£机;异常检测;强化学习。
ll
摘要
Abstract
isanew flameto
mechanicstheory how state
Computational analyzegeometric
文档评论(0)