- 0
- 0
- 约2.87万字
- 约 41页
- 2026-01-22 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN120151495B(45)授权公告日2025.07.11
(21)申请号202510451910.X
(22)申请日2025.04.11
(65)同一申请的已公布的文献号申请公布号CN120151495A
(43)申请公布日2025.06.13
(73)专利权人浙江工业大学
地址310000浙江省杭州市拱墅区朝晖六
区
(72)发明人黄亮李玉琪池凯凯张书彬
(74)专利代理机构杭州研基专利代理事务所(普通合伙)33389
专利代理师于森
(51)Int.CI.
HO4N13/194(2018.01)
HO4N21/647(2011.01)
(56)对比文件
CN117939192A,2024.04.26CN116962414A,2023.10.27
审查员陈博
权利要求书3页说明书16页附图1页
(54)发明名称
基于多智体强化学习的VR视频自适应码率控制方法
(57)摘要
CN120151495B本发明提供基于多智体强化学习的VR视频自适应码率控制方法,涉及VR技术领域,包括获取历史视频块传输数据预测带宽并评估网络稳定性,基于多层感知机结构的Actor网络输出码率选择概率分布,对视频块计算结构相似度和重缓冲指标构建综合奖励函数,利用多智能体联合状态向量获取局部观测信息并通过注意力权重整合群体信息,采用策略梯度方法和Adam优化器更新网络参数实现码率优化。本发明能够有效提升VR视频传输质量,降低重缓冲概率,保证用户
CN120151495B
获取历史视频块传输数据并采用预测带宽,构建网络延迟特征向量评估网络稳定性,基
获取历史视频块传输数据并采用预测带宽,构建网络延迟特征向量评估网络稳定性,基
制,结合视频流带宽份额动态调整,基于质量评分、切换影响及网络稳定性选择最优码
基于网络延迟特征向量构建包含缓冲区状态及视频质量状态的特征向量,将特征向量输
人多层感知机结构的Actor网络,通过ReLU激活函数和Softmax函数输出码率选择概率分布,基于视频质量、缓冲区状态及切换平滑度构建综合奖励函数,结合经验池批量采样确定
码率级别
对视频块计算结构相似度获取质量映射值,基于下载时间和缓冲区状态计算重缓冲指标,结合质量差异和时间衰减权重评估质量变化,采集视口位置信息计算平滑度和预测误差,依据视场角覆盖率和空间质量分布确定视频沉浸度,将指标构建综合奖励函数并归一化,基于折扣因子计算累积奖励并优化权重系数
构建多智能体联合状态向量获取局部观测信息,利用时序差分目标优化Critic网络的均方误差损失,结合策略梯度和熵正则更新Actor网络,采用同构智能体参数共享和异构智能体独立更新机制,通过注意力权重整合群体观测信息
在经验池中持续存储状态向量交互数据,利用多层感知机提取网络特征,基于特征向量构建自适应奖励函数,采用策略梯度方法和Adam优化器更新网络参数,根据体验质量差值调整奖励权重,从经验池采样持续优化码率选择策略
CN120151495B权利要求书1/3页
2
1.基于多智体强化学习的VR视频自适应码率控制方法,其特征在于,包括:
获取历史视频块传输数据并采用预测带宽,构建网络延迟特征向量评估网络稳定性,基于预测带宽和缓冲区状态建立码率切换影响模型,通过缓冲区状态转移方程进行阈值控制,结合视频流带宽份额动态调整,基于质量评分、切换影响及网络稳定性选择最优码率;
基于网络延迟特征向量构建包含缓冲区状态及视频质量状态的特征向量,将特征向量输入多层感知机结构的Actor网络,通过ReLU激活函数和Softmax函数输出码率选择概率分布,基于视频质量、缓冲区状态及切换平滑度构建综合奖励函数,结合经验池批量采样确定码率级别;
对视频块计算结构相似度获取质量映射值,基于下载时间和缓冲区状态计算重缓冲指标,结合质量差异和时间衰减权重评估质量变化,采集视口位置信息计算平滑度和预测误差,依据视场角覆盖率和空间质量分布确定视频沉浸度,将指标构建综合奖励函数并归一化,基于折扣因子计算累积奖励并优化权重系数;
构建多智能体联合状态向量获取局部观测信息,利用时序差分目标优化Critic网络的均方误差损失,结合策略梯度和熵正则更新Actor网络,采用同构智能体参数共享和异构智能体独立更新机制,通过注意力权重整合群体观测信息;
在经验池
您可能关注的文档
- CN119992539B 一种花生内霉快速筛查方法及系统 (泗水县锦川花生食品有限公司).docx
- CN120011322B 基于多模态数据融合的设备运维数据管理系统及方法 (航天智控(北京)监测技术有限公司).docx
- CN120013364B 一种科技期刊新媒体影响力评价方法及系统 (长江水利委员会网络与信息中心).docx
- CN120013938B 基于显微图像的加工表面质量检测系统及方法 (上海蛮吉光电科技有限公司).docx
- CN120028648B 一种基于大数据电缆系统故障分析方法 (福州安蒲特电气有限公司).docx
- CN120030153B 一种基于神经网络的跨领域书籍推荐方法及系统 (西昌学院).docx
- CN120030420B 基于改进变换网络的变压器局部放电智能诊断方法 (江苏前景瑞信科技发展有限公司).docx
- CN120031360B 一种多队列并行的物流预约排队系统及方法 (上海诺捷信息科技有限公司).docx
- CN120031969B 基于多重对应点协同配准的激光语义同步定位与建图方法 (南京邮电大学).docx
- CN120032071B 基于模糊坐标补偿的桩基预埋区域智能测绘方法及装置 (青岛旭域土工材料股份有限公司).docx
- CN120283534A 一种联合收割机安全控制方法、装置和系统 (潍柴雷沃智慧农业科技股份有限公司).docx
- CN120283867A 肉类替代产品、用于制造其的方法和双螺杆挤压机 (维利奥有限公司).docx
- CN120284157A 一种拖扫一体清洁滚筒多喷嘴清洗装置、清洁工具及控制方法 (湖北穿石智能电器有限公司).docx
- CN120285309A 一种植入式可吸收pla复合材料及其制备方法 (山东第一医科大学附属颈肩腰腿痛医院(山东省医学科学院颈肩腰腿痛医院)).docx
- CN120286096A 用于高吞吐量微滴操纵的方法和设备 (光投发现有限公司).docx
- CN120287161A 一种四列圆柱轴承滚道磨削加工装置及方法 (瓦房店正达冶金轧机轴承有限公司).docx
- CN120287313A 一种基于多传感器数据融合的物料抓取偏移实时补偿方法及装置 (成都环龙智能机器人有限公司).docx
- CN120287526A 基于机器视觉的模具加工注塑方法、装置、设备及介质 (深圳市绿星科技有限公司).docx
- CN120287910A 电动汽车充电桩自动切断方法、系统、设备及存储介质 (西安艾润物联网技术服务有限责任公司).docx
- CN120288091A 轨道用障碍物探测方法和障碍物探测系统 (圣途科技(深圳)有限公司).docx
原创力文档

文档评论(0)