基于领域知识内嵌的深度学习网络流量预测研究.docxVIP

基于领域知识内嵌的深度学习网络流量预测研究.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

54

54 2023/07/DTPT

基于领域知识内嵌的深度学习

网络流量预测研究

0前言

流量预测是计算机网络管理和优化中的重要任务,其目标是分析和预测网络中的数据流量,为网络资源的规划、调度和管理提供依据。近年来,随着互联网的快速发展和智能化应用的不断增加,快速增长的用户需求和网络规模对当前的网络基础架构带来了许多挑战。流量预测是指根据过去的流量观测数据,对未来一段时间内的网络流量进行估计和预测。

——————————

收稿日期:2023-06-16

传统的流量预测方法通常依赖于统计模型[1]和时间序列分析算法[2-3]。随着以深度学习为代表的人工智能技术逐渐成熟,基于深度学习的流量预测算法逐渐成为研究的热点[4-5]。然而,当前数据驱动的深度学习范式在复杂动态的网络流量环境中存在模型功耗大、存储成本高、算法难优化等问题。考虑到人的快速学习能力是建立在对任务完备的背景知识之上,且有科学的公理系统支撑。因此,本文基于深度学习方法提出了一种基于领域知识内嵌的全流程框架,以实现快速精准的流量预测,从而实现更符合现实场景的网络资源分配,为智能化网络提供决策能力。

1流量预测研究背景

随着互联网技术的普及,网络流量快速增长。根据中国互联网信息中心发布的第47次《中国互联网络发展状况统计报告》,我国网络用户数不断增加,使用移动设备的网民比例高达99.7%,移动互联网接入的流量也呈现快速增长趋势[6]。然而网络运营商如果长时间、大规模地维持如网络基站与服务器等流量承载设施,将产生高昂的运营支出。考虑到大部分网络在小时或日尺度上存在的繁忙间歇性与规律性,可以对周级的短期流量进行预测,帮助移动网络运营商及时调整射频资源的分配。因此,流量预测已成为移动网络运营商降低运营成本,提升用户体验的重要任务。

2基于领域知识内嵌的流量预测框架

2.1总体研究方案

图1所示为本文所提出的基于领域知识内嵌的流量预测总体框架。考虑到流量数据存在的偶发性强、时域分布不确定性高的问题,本研究提出了基于JS散度的数据分布检测算法对原始数据中的时域和频域异常数据进行清洗,以避免异常数据干扰模型学习。

在模型设计的过程中,考虑到流量数据本身存在的自相似性、长时相关性、周期性等特点,本文设计了动态时域生成流量预测模型(GDTN)。GDTN能够在使用卷积生成网络对流量数据进行去噪-复原的同时,自动分配同期多时域流量特征的重要性,以捕捉输入流量数据中存在的规律变化的模式,提升模型的学习效率与预测性能。整体而言,本文提出的基于领域知识内嵌的流量预测框架通过综合应用数据清洗、数据驱动的特征提取和领域个性化的模型设计等技术,能够实现准确预测流量数据的目标。

2.2基于JS散度数据分布异常检测算法

JS散度数据分布异常检测算法的核心思想是以JS散度衡量序列数据之间的距离,衡量2个同宽度的相邻或相隔一定天数的滑动窗口内的序列数据之间的距离,并应用孤立森林异常点检测算法检测数据分布发生明显改变的间断点。图2所示为本文所提出的分布异常检测算法,主要包括序列相似性度量、孤立森林异常检测2个部分,当孤立森林检测算法判定异常且时域分布差异大于设定阈值2个条件同时满足时,判定为该数据存在异常。接下来,本文对该算法进行详细介绍。

(a)频域异常流量数据 (b)时域异常流量数据

下行流量 上行流量

流量值/

流量值/字节

过滤 过滤

下行流量

流量值/字节

流量值/字节

时间/日

(c)流量预测模型设计

数据训练

时间/日

自相似性网络

流量 长时相关性领域

知识

周期性

动态注意力网络深度

网络设计

卷积生成网络

图1基于领域知识内嵌的流量预测总体框架

56

56 2023/07/DTPT

序列相似性度量

滑窗子序列分割

孤立森林异常点

孤立森林异常点检测

属于异常点

输入流量序列

KDE概率密度估计

JSD距离测算

时域分布差异大于阈值

同时满足

数据分布异常

图2基于JS散度的数据分布异常检测算法

2.2.1基于JS散度度量序列相似性度量

一般的序列相似性度量方法往往基于欧式距离、形状距离[7]或模式距离[8]将时间序列视为高维向量进行处理;然而,由于大量的偶发流量事件,使得流量数据异常频发且异常流量往往高出正常流量几个数量

在这种随机分割的策略下,异常点通常具有较短的路径。

为便于描述,定义异常分数为:

给定一个包含n个样本的数据集,树的平均路径长度为:

级,因此基于距离的相似度衡量算法并不适用于流量

数据。为解决这一问题

文档评论(0)

新思想与新技术 + 关注
实名认证
文档贡献者

新思想与新技术

1亿VIP精品文档

相关文档