采用广域子空间分解降维的网络流量准确预测王艳淑,王方(郑州经贸职业学院计算机系,郑州)摘要:网络数据流量的准确预测是评判和选择最佳Web服务的一种重要标准。传统的网络数据流广域子空间流量预测方法没有进行分解降维处理,预测误差较大,无法对大跨度的网络流量进行准确预测。提出一种基于广域子空间分解降维的网络数据流量准确预测方法,把网络流量数据流构建广域子空间进行预处理,在广域子空间中对数据进行分解分析,把提取的高维特征涵摄在广域子空间中,进行广域子空间分解降维,然后将广域分析的结果与子空间降维分析的结果进行有效的数据融合,实现对整个网络流量分析数据的准确预测。仿真测试表明,采用基于广域子空间分解降维的方法进行网络数据流量预测,可以精确预测网络流量渐变过程,结果准确,且计算开销明显降低。关键词:流量预测;广域子空间;降维中图分类号:TP393文献标识码:A文章编号:1001-7119(2014)08-0110-,(,,,China):.Tra⁃,..Thein-cted..,⁃d.wthat,⁃,,i⁃.:;;ion0引言随着计算机网络技术的不断发展,网络流量的准确预测和评估,是提高网络服务质量,预防网络拥堵,实现网络智能调度的关键[1~3]。
网络流量本质上是1组时间序列,采用时间序列分析的方法和信号处理理论,对网络流量序列进行分析处理,实现精确预测,受到广大研究者的关注和重视[4]。目前关于网络数据流量预测方法研究处于初级阶段,通过提高预测的准确性,可实现对网络服务和数据的处理传输过程中的丢包、网络堵塞、信息安全等现象的有效预防和控制[5]。本文提出一种基于广域子空间分解降维的网络数据流量准确预测方法,通过构建广域子空间对网络流量数据流进行高维建模处理,在广域子空间中对流量特征信息进行信号分解分析,提取数据的深层次特征。把提取的高维特征涵摄在广域子空间中,进行广域子空间分解降维,然后将广域分析的结果与子空间降维分析的结果进行有效的数据融合,实现对整个网络流量分析数据的准确预测[6]。最后用仿真实验验证算法性能,得出算法在预测网络流量序列中准确性和实时性较传统方收稿日期:2013-07-23作者简介:王艳淑(1981-),女,河南濮阳人,硕士研究生,讲师,研究方向:计算机软件。第30卷第8期2014年8月科技通报.30No.8Aug.2014第8期法具有优势。
1广域子空间分解降维的提出首先构建网络流量序列广域子空间模型,为实现流量预测奠定模型基础,本文需要对网络流量序列构建的子空间模型进行降维处理,降低计算开销,同时提高预测计算的准确度。广域子空间分解降维算法描述如下。令Rd×L为d×L维数的矩阵,表征网络流量序列的d×L维广域子空间,当维度L每次进行特征向量提取运算的数据长度,对于每一个预测模型,空间矢量表示为:R1={X1,X2,X3,∙∙∙,Xd}T(1)得到网络流量预测相关函数为:R1TR1={X1,X2,∙∙∙,Xm}{X1,X2,∙∙∙,Xm}T(2)采用自相关特征奇异分解方法对上式进行特征值分解得,子空间特征分解表达式为:R1TR1=V1∑1V1T(3)从L+1到2L维网络数据流量预测分析数据迭代类推得到:R2TR2=V2∑2V2T(4)R2={Xd+1,Xd+2,∙∙∙Xd+m}T(5)构建无向图G=(V,E)中,用dG(u,v)表示图G中从u到v最小跳数。节点u的邻居节点为:N1(u)={v|(u,v)∈E}(6)网络流量序列在广域子空间中构成的无向图网络节点u的2-hop邻居节点为:N2(u)={v|dG(u,v)= 2} (7)其中网络流量序列广域子空间无向图节点与u 相距两跳、且相互独立的支配点集为:D2(u) = N2(u) ⋂MIS (8)此外,用ann(u, r1, r2, α) 表示以节点u 为圆心,角度为α ,半径在r1和r2之间的环形区域。
式中,流量的广域特征解向量为:V =[V1, V2, ∙∙∙, Vm] ∈ Rm× m(9)V ∈ Rm× m在广域子空间中具有正交向量解,且向量解彼此正交,从而得到:VVT= IM,∑= diag(σ1, σ2, ∙∙∙, σm) ∈ Rm× m(10)上式即为提取的RTR 的网络数据流量预测分析数据的特征值,这些特征值之间存在大小关系,为:≤×[(1 + Dˉ)M]χ(11)对于向量V ,是R2TR2的规范正交基特征向量,特征值diag(σ1, σ2, ∙∙∙, σm) 中,其中含有网络数据流量预测信息的所有状态信息,能有效表征研究的网络数据流量预测分析数据的状态参量。通过上述方法,可以把网络流量序列构建的广域子空间从d × L 维降低为m维,从而实现了高维多层特征向量降低为m 维单层特征向量,同时,在diag(σ1, σ2, ∙∙∙, σm) 特征解中,有效包含了流量数量的全部特征信息,在降低计算维数,降低运算量的同时,保证了预测的准确性。2 网络流量预测关键技术与实现2.1 算法描述本文通过上述方法把网络流量数据流构建广域子空间进行预处理,并进行广域子空间降维处理。
在网络流量预测中通过子空间分解,在广域子空间中对数据进行分解分析,提取数据的深层次特征,把提取的高维特征涵摄在广域子空间中,对网络流量分析数据进行预测。实现过程描述如下:假设网络流量数据预测分析时在t 时刻的预测分析数据信息度DCT(xt) = p(xt| d0, ⋯, t) 为N ,代表随机的预测分析样本数据集合,则系统预测分析集合定义为:St={ }sjt(xjt, wjt) ; i = 1, 2, ⋯, N (12)其中:xt为预测分析样本的实际预测分析数据;wt为相应的xt的权值向量。从而,预测分析系统提取分解降维后的深层次特征定义为:xk= f {xk – 1, uk – 1, wk – 1} (13)其中,uk为预测分析数据的输入模型化,比如预测分析次数,频率等参数;wk为预测分析统计值。把提取的高维特征涵摄在广域子空间中,得到流量预测广域分析测量方程为:zk= h(xk, M, vk) (14)其中,M为预测分析时系统的正常状态;vk为异常流量扰动的预测分析数据。本文基于广域子空间分解降维的预测分析系统,得到预测信任度表达式定义为:Hk(xt) = p(xt| zt, ut – 1, zt – 1, ⋯, u0, z0) (15)将广域分析的结果与子空间降维分析的结果进行有效的数据融合,提供了各个低维子空间详细的数据深层结构特征,为准确预测流量数据提供了丰富的数据源,将广域分析的结果与子空间分解降维分析的结果进行有效的数据融合,实现对整个网络流量分析数据的准确预测。
2.2 预测性能分析采用网络流量预测误差评价方式,评价本文算法对网络流量预测性能,在提取的网络数据流量预测分析数据的特征值RTR 中,特征值之间存在大小关系,对王艳淑等.采用广域子空间分解降维的网络流量准确预测 111第30卷 科 技 通 报预测序列特征值进行正交分解得到:RTR=[VsVn]éëêêêêùûúúúú∑s00∑n[VsVn]T(16)由于本文特征提取算法中采用多次迭代求解特征值实现网络流量序列预测,用网络数据流量有效预测与网络数据流量预测误差比ΔSNR(i) 表示i 次网络数据流量预测特征信号的预测性能,ΔSNR(i + 1) 表示经过i + 1 次迭代,对于网络数据流量预测的有效性提高量,循环迭代,当下式成立时:ΔSNR(i + 1) < ΔSNR(i) (17)则循环结束,最终得出本文算法得到网络流量预测误差最小,具有最优化预测性能。3 仿真实验与结果分析为了验证本文算法对网络流量预测的优越性,采用对比分析的方法进行仿真实验。研究的网络流量数据采集于本校计算机网络中心的监测数据,在中心交换机进行采集分析,采集时间为2013 年10 月17 日至27日的流量信息,采集样本每天为一段,作为一组样本实验集。
首先进行广域子空间建模,构建无向图网络,把网络流量数据流在构建广域子空间进行预处理,并提取网络流量序列的广域特征,得到特征频谱分布如图1所示,采用本文提出的广域子空间分解降维方法得到降维处理后的特征分布如图2所示。可见,采用本文方法得到的特征分布有效包含了流量数量的全部特征信息,在降低计算维数和降低运算量的同时,保证了预测的准确性。图1 广域子空间分解降维前特征分布Fig.1 wide area ty 图2 广域子空间分解降维处理后的特征分布Fig.2 after wide area ty 图3 网络流量序列预测仿真结果Fig.3 of 在上述实验处理的基础上,以广域子空间分解降维处理后的特征分布为数据基础,得到网络流量预测仿真结果如图3所示,图3可见,采用本文方法,得到的预测结果比传统方法预测误差减少明显,预测精度达到99.7%,而传统方法仅有87.3%。采用基于广域子空
发表回复