7-庞爱心-基于零和博弈思想的水下目标异步定位算法研究 -.docxVIP

7-庞爱心-基于零和博弈思想的水下目标异步定位算法研究 -.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

.

燕山大学

本科毕业设计(论文)中期报告

课题名称:基于零和博弈思想的水下目标异步定位算法研究

学院:电气工程学院

年级专业:自动化

学生姓名::庞爱心

指导教师:闫敬

填写日期:2022.4.21

任务书中本阶段工作目标与任务要求

学习水下传感网络概念。建立水下网络框架。

学习悉水下特性,熟悉其中所包含的物理过程,主要考虑时钟异步和声线弯曲两大特性。

建立水下异步定位协议,由于水下环境中距离测量误差较大,考虑使用TOF的方式,从时间差的角度出发建立优化问题。

最后,拟通过q学习的方法来求解优化问题,进而寻求最优估计位置。

使用最小二乘的方法,对比使用q学习方法的定位误差,进行比较分析。

目前已完成任务情况

首先,以锚节点为辅助节点的水下传感器网络节点定位算法进行设计研究。设计了网络中节点的交互方式,实现了整个网络的定位。

其次,进一步研究了节点之间信息传播,并且分析了声线弯曲对定位结果的影响程度。通过给出声速模型,求解了节点间的传输时延,然后在声线补偿的前提下构建异步算法消除时钟偏差的影响。

最终通过最小二乘算法实现了传感器节点的定位。

2.1构建水下传感器网络,包含三种节点:水面浮标:漂浮在水面,主要作用是协助水下传感器节点进行自定位;锚节点:主要用于节点的发现,在整个水下网络通信中,锚节点可以被其他任何节点发现和通信;目标节点:可通过向传感器广播请求来启动整个定位过程。

2.2时钟模型:为了解决时钟异步给定位算法带来的影响,因此,给出水下传感节点使用的时钟模型为,式中T表示传感器节点记录的时间,t表示真实时间,是传感器节点记录的时间相对于真实时间的时钟偏移,是传感器节点记录的时间相对于真实时间的时钟倾斜。

2.3声线弯曲下的传输时延:考虑到声线弯曲的水下特性,传播时间越长,各节点间有效声速相差越大,声线弯曲引起的定位误差也越大。因此,水下定位时,声线弯曲是需要考虑的。给定的声速模型为,通过分析,可以得到声线弯曲下求解的传输时延公式,利用声线弯曲下求取的传输时延设计定位算法。

2.4具体交互过程如下:

(1)目标节点s在,时刻作为发起点向网络中发送信息,信息中包含锚节点的发送顺序,依次为,接下来普通传感器节点s进入等待模式,等待由锚节点发送的返回信息。

(2)锚节点按照发送顺序依次向网络中发送时钟以及位置信息,其中,第1个到第个n-1锚节点发送信息后接收的时刻值为,。当最后一个锚节点n接收到前面n-1个锚节点发送的信息后,再由锚节点n在时刻向传感器节点发送所有接收到的时间戳信息以及所有锚节点的位置。

(3)当目标节点s接收到最后一个锚节点发送的信息时,由此,完成了次完整的信息收集。其中目标节点收集的时间戳信息。

2.5目标节点的定位:

使用到达时间差算法,消除时钟偏差的关系式:

接下来可以获得相应的时间测量值与定位位置的关系

式中,有上述时延公式获得。是考虑到测量误差的等效噪声。噪声有界且满足高斯分布。的方差,的方差,其中为每个测量值的方差。将目标节点s的定位问题表述为:

其中可以通过测量其中的时间传输过程来测量,其他时间量都是未知的函数,与目标节点的位置有关因此优化问题可以通过估计目标节点的位置的值来实现。

优化问题可以表述为。

2.6优化定位算法

(1)使用最小二乘法解决优化问题:

由上式构建非线性关系:

其中,,表示目标节点的位置,其中表示锚节点在X轴和Y轴的位置,是是测量向量,是测量噪声。

非线性估计进行泰勒级数展开,得到以下关系式

是第i次迭代的估计值,是雅克比矩阵,如下

因此,迭代最小二乘增量为

式中,

基于第i次估计值,第i+1次迭代值可以表示为,

当满足时,定位完成,表示迭代终止标准。

参考文献郭东波.基于声线补偿下水下传感器网络定位算法研究[D].燕山大学.的思路进行最小二乘的仿真。在1000m的区域布置一个目标节点作为待定位点,多个锚节点随机分布在区域内,在定位时择优选取。仿真中假定每个节点的传输距离足够大。仿真中使用了一些参数,其中给定的数值分别为a=0.017,b=1473m/s,mea=0.001,s=0.1。对于定位误差,由于声线弯曲的存在导致声速不是一个定值,通过改进到达时间差(TDOA)来解决时钟异步。考虑到可以直接通过压力传感器精确获得,目标节点的定位误差为。其中,是定位算法所得位置,是真实位置。仿真还在编写过程中。

三、存在的问题和拟解决方法

在学习过程中已经了解学习了最小二乘的算法以及仿真。对于强化学习求解有了一定的了解但Q学习求解仍存在一些问题。对于q函数模型的建立仍然一知半解。

强化学习的框架如下:

马尔可夫决策过程(MDP)由S,A,R,

文档评论(0)

讨厌落差感 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档