基于亚波长光栅衰减模态滤波器的设计与研究
2020-02-25
来源:小奈知识网
a叶梭2017年第30卷第5期 Electronic Sci.&Tech./May.15.2017 协议・算法及仿真 doi:10.16180/j.cnki.issnl007—7820.2017.05.001 基于亚波长光栅衰减模态滤波器的设计与研究 李鹏程 (中国电子科技集团公司第20研究所雷达部,陕西西安710068) 摘要如何高效地进行视频数据压缩是一直备受关注的研究问题。张量是高维数据的自然表示,张量紧凑表可 以大幅降低原始数据维数,且能非常近似地恢复原数据。文中根据张量紧凑表示概念提出张量迭代Tucker—ALS算法, 并将该算法应用至视频压缩中,取得较好的压缩效果。通过测试序列仿真并运用BD—rate比较方法进行压缩性能评估, 相比于目前成熟的H.264算法,文中所提出的迭代Tucker—ALS算法在低码率时性能有所改善,对于纹理类视频性能改 善显著。 关键词张量分解;张量迭代Tucker—ALS算法;视频压缩 TN919.8 文献标识码A 文章编号1007—7820(2017)05—001—04 中图分类号Video Compression Algorithm Based on Tensor Compact Representation LI Pengcheng (Radar Division,20th Research Institute of China Electronics Technology Group Corporation, Xi’an 710068,China) Abstract Efficient video data compression is always a research concern.Tensor is a natural representation of high dimensional data.and tensor compact representation call greatly reduce the dimension of original data and recov— er the original data very wel1.Base on the concept of compact representation of tensor,we propose the tensor iterative Tucker—ALS algorithm for better video compression.The comparison of the simulation results with those by the BD —rate method shows that the proposed tensor iterative Tucker—ALS algorithm can improve the performance compared with the mature H.264 algorithm at low bit rates with signiicantly ifmproved performance for texture video. Keywords tensor decomposition;tensor iterative Tucker—ALS algorithm;video compression 动态纹理视频是视频数据中重要的一个分类。生 活中存在着各种各样的纹理类视频,如波动的水面,晃 动的火苗等。目前技术成熟的H.264视频编码方案 是混合编码结构的压缩编码方式,尚不能充分利用纹 1 张量及张量紧凑表示 当坐标系改变时满足坐标转换关系的有序数组成 的集合称为张量 ]。直观理解一个 阶张量A∈ 理类视频本身数据的内部特征,因此如何对纹理类视 R,l “ g是指包含有1-I%,。・n 个元素的数表,其中 频进行有效压缩始终是一个研究热点。 A=(Ⅱ ,,…,im),口i.,…,im∈R, f∈{1,…,凡 J=1,…,m 张量作为高维数据的自然表示,能很好地表征视 (1) 频这一类高维数据。北京大学彭立中教授最早提出张 张量紧凑表示_2I4 的描述性的定义为:对于给定 量紧凑表示的概念,并给出张量紧凑表示的描述性定 的数据A,如果存在一个变换厂将A变换为某种结构 义。张量紧凑表示可以大幅降低原始张量维数,对于 在某个维度有大量冗余数据的张量,降维效果尤其显 著。基于张量紧凑表示这一特性,本文提出了基于张 量紧凑表示的视频压缩算法。 性的系数C,并且满足如下条件:(1)系数个数要少,而 且结构性要好;(2)这些系数能够刻画原始数据的特 定性质。那么,对于原始数据的性质来说,系数c就 是原始数据的一个紧凑表示。 张量A,口吻合度的测度fit(A,B),用一个>0<l 的数值表示,数字越接近1,表示张量A, 相似程度越 收稿日期:2016-11-07 高。其表达式为 ift(A,B)=1一 基金项目:国家自然科学基金(61671361) Il:±lI墨【I:= I IA II 堡 (2) 作者简介:李鹏程(1988一),男,硕士,助理工程师。研究方向: 张量分析及典型应用。 WWW.dlanzik ejI.ortl J 协议・算法及仿真 李鹏程:基于张量紧凑表示的视频压缩算法 2 基于张量紧凑表示的视频压缩算法 量。通过交替最小二乘算法迭代求解上式中各个矩 阵,直到算法满足终止条件时停止迭代,最终得到 为了能够获得理想的张量紧凑表示,本文提出张 的估计值 (1), (2), (3), (4),核 量迭代Tucker—ALs分解(MrI'TALS)算法,算法核心 (1), (2), (3), (4)思想是:首先对张量进行Tucker—ALS分解,进而得到 张量C的估值为:C=A×1X‘ ,X 2X‘ , × ( )T×d ( )T 原张量与近似张量的差张量;然后对差张量再进行 .Tucker—ALS分解,直到满足终止条件;最后对多次张 张量Tucker—ALS算法终止条件为:(1)迭代次数 量Tucker—ALS分解的系数进行整合,得到原张量的 超过预先设定的最大迭代次数time—max(ALs);(2)两 一个紧凑表示,该紧凑表示可以很大程度上降低原始 次相邻的迭代中,吻合度的变化小于预设值Afit 数据维数。将视频数据表示成张量,通过张量的紧凑 (ALS)。 表示实现视频数据降维。本文正是基于这一思路提出 2.2视频压缩算法具体实现 基于张量方法的视频压缩算法。 对 , , 进行一次分解就能得到一组分解结 2.1 张量Tucker分解最小二乘近似 果,根据核张量及分解矩阵本身的特点对核张量c、分 Tucker 在1963提出了的高维张量分解法是主 解矩阵 “’采用不同的压缩步长,核张量采用13 bit 成分分析法(Principal Component Analysis,PCA) 在 线性量化,分解矩阵 “’采用7比特线性量化,最高位 高维矩阵上的扩展。Tucker分解是将 阶张量A∈ 均为符号位。 R 一 分解成核张量C∈R lx.一 与N个矩阵 ‘ 大步长会带来大的量化误差,在本文提出的算 ∈R xRn的n模式乘积,其中n=1,…,Ⅳ。 法中,每次用量化结果恢复合成张量A进行下次迭 以3阶张量A∈R “ ,张量A的Tucker分解可 代,如此随着迭代次数增加,量化误差带来的峰值信 以表示成 噪比下降会被极大减弱。在相同的迭代次数下,与 A≈C X, (¨X, ( )×( )= , 不引入量化误差的结果相比较,峰值信噪比下降了 R1 R2 R3 0.03 dB。 r1 ∑∑∑c1 r2 1 r3 1 ・ ’・ (3) 对数据进行分块,可以更加充分利用数据本身的 在张量Tucker分解的低秩逼近中,经常采用交替 内聚性获得较高的压缩率。u , 的尺寸只有y 的 最小二乘(Alternating Least Squares,ALS)法 求解结 1/4,U , 各分成一块。 保存着视频每帧图像的灰 果,将张量高维奇异值分解方法 分解的结果作为算法 度值,包涵图像最丰富的信息,需根据视频本身特点进 初始迭代点。张量Tucker—ALS分解的推导如下: 行合理分块。 张量Tucker—ALs分解是范数意义下的最优逼 基于以上分析,本文给出基于张量紧凑表示的视 近,所以张量A最优秩(R。,R ,R , )逼近表示成如 频压缩算法实现具体步骤: 下最小化问题 步骤1输入。读人YUV格式视频文件,保存成 min IIA—C X 1 x2X x3X‘。 x4X‘ ’II ,U , ,预留空张量C E R xR2 ,“,y ∈ c, 5.t. ( ) X( )=IX( ) X( )=JX( ) X( )= R 姗 ,凡=1,2,3,i=Y,u, ,保存分解结果; ..J. ( ) ( ):J (4) 步骤2初始化。K—max,PSNR—max,code—len, 其中核张量c必须满足:C=A× X‘ ×2X‘ framemax,region_—size,time—max(ALS)Afit(ALS),秩 ×, ( ) ×( )T 尺1, 2,R3; d 上式最小化问题可表示成如下最大化问题 步骤3数据分块。根据region—size的尺寸将 分 x(J】 署盔,) )lIA×1x x2X ×3 。 ×4 H II 块,并编号为Bum; 5.t. ( ) ( )=,( ) ( )=J( ) ( )= 步骤4 Yt分解。(1)for i=1,…,hum;(2)K=0,Y 。 . ,。 ( ) ( ):I (5) _region=0;(3)对Y_region进行Tucker--ALS分解,并 假定求解的是x‘¨, ‘ ,x‘ ,x‘ ,已知,上式最 保存核张量和分解系数直到MTI'ALS算法满足终条 大化问题可重写成如下矩阵形式 件;(4)通过k个核张量c 和分解矩阵 恢复合成 lI x‘ ’ z I1。,z=A(11( ‘ o ‘’ o ‘ ) (6) 张量Y_region; 此时上式最大化问题的最优解转变成求解z矩 步骤5分块拼接。通过Y_region拼接 ; 阵的奇异值分解,即 f11为矩阵z的前尺 个奇异列向 步骤6 U , 分解。(1)对U ,y 进行Tucker一 2———————————WWW.dianzikoji.org 李鹏程:基于张量紧凑表示的视频压缩算法 协议・算法及仿真 ALs分解,保存核张量和分解系数,直到MTFALS算法 满足终止条件;(2)通过k个核张量 和分解矩阵 ¨,其中,£代表帧数; ’代表第i帧的原始图像;,(1’代表 第i帧的合成图像。 恢复合成张量; 步骤7量化编码。 , , 分解产生的核张量和 3仿真结果及性能分析 本文选用5个CIF序列进行仿真,并与 分解矩阵进行量化编码; 步骤8计算结果。(1)计算 , , 峰值信噪 比;(2)统计比特数。 H.264 加 官方编译器JM ” 在低码率下进行比 较。算法参数值设定为:Afit(ALS)=10~,time—max (ALS)=100,code—len=6,Rl=R2=R3=3,帧长= 100,选取QP为34,36,38,40共4点的峰值信噪比 和平均码率进行比较,通过BD—rate方法计算性能 改善结果。张量方法没有QP概念,因此选择峰值信 噪比相近的点进行对比,对于平均码率通过式(8) 获得 Bitrate=总比特数×25/frame—max×1 000(8) —张量迭代Tucker—ALS分解算法的终止条件:(1) 张量Tucker—ALS分解的迭代次数超过了预设的最大 迭代次数K—max;(2)合成张量的PSNR超过了预设值 PSNR—max。 本文采用平均峰值信噪比衡量视频质量,平均峰 值信噪比定义为 一= 。( 等 )(7) 表1本文方法与H.264性能比较 为了进一步说明纹理类视频压缩效果,对视频 有所改善,container相对于H.264性能略微有所下 birdge—far的高码率进行仿真,并绘制出birdge—far 的 —D(率失真)曲线图,同时随机选取两帧图像展 示视频恢复效果。 如表1所示,对于测试序列birdge—far,birdge —close,hall—monitor,akiyo本文提出算法比 降。如图2所示,在码率区间40—125之间,本文 提出方法能获得更好的压缩性能。在平均码率55 kbit・S 处取得峰值信噪比最大差值为0.68 dB。 固定峰值信噪比为37.73 dB,本文方法所需的平均 码率为66.96 kbit・S~,而H.264的码率为 123.91 kbit・S。。,码率降幅约为50%。 H.264算法在峰值性噪比与平均码率方面性能均 WWW.di ̄,nziRejr 0l-g 协议・算法及仿真 李鹏程:基于张量紧凑表示的视频压缩算法 『J].IEEE Transactions on Circuits and Systrms for Video Technology,2013,23(2):280—288. ∞ [3] Peng Lizhong,Peng Lizhong,Zhang Fan.Video dimension re— 丑 也 j型 duction and coding using muhiple tensor Rank——R decompo-- sition[C].Beijing:International Congress on hnage and Sig— hal Processing.20I】. 骘 [4] 0 Peng Lizhong,Peng Lizhong,Zhang Fan.Higher—order SVD analysis for cruwd density estimation[J].Computer Vision and Image Understanding,20l2(8):1014—1021. 平均码率/kB・s 图1 birdge—far率失真曲线图 [5] Tucker L R.Implications of factor analysis of three—way ma— trices for measurement ot change[M].Wisconsin:University of Wisconsin Press,1 963. [6] Jollife I T.Pri rndpal component analysis[M].New York: Springer—Verlag,2002. [7] Carroll J D.Chang J J.Analysis of individuM di?erences in multidimensiona1scaling via an n — way generalization of ‘eeka ̄一young’decomposition[J].Psyt・hometrika,1970, 35(4):283—319. 图2 bridge—far第50帧图像 [8] Harshman R A.Foundations of the PARAFAC procedure: Models and conditions for an‘explanatory.’multi—modal factor analysis[J].UCLA Working Papers in Phunetics, 1970(16):1—84. [9] Lathauwer L D.Moor B D.Vandewalle J.A muhilinear singu— lar value 0n1 sili‘)n[J].SIAM Journal on Matrix Analysis and Applications,2000(21):I253—1287. [10] 张亚运,孟李林,景博利.H.264解码器的帧内预测优化 图3 bridge—far第60帧图像 [J].电子科技,2016,29(4):64—65. 廖怡.基于 FMS320DM648的H.264视频压缩系统[J].电 子科技,2013,26(9):160—163. Ales H F,Cizmeci B.Decoder side true(notion estimation fo [12] 4 结束语 本文用张量表示视频数据,通过张量的紧凑表示 实现视频压缩,提出了将张量分解应用到视频压缩的 very low bitrate B—frame coding[C].UT,USA:18th IEEE International Cont ̄ren(・e on Image Processing(ICDP),201 1. 张量迭代Tucker—ALS算法,通过与H.264进行对比 分析可以看出基于张量紧凑表示的视频压缩方法是有 效的,尤其对于固定场景的或动态纹理类视频压缩压 缩效果显著。 [13] HHI.JM software[EB/OL].(2012—05—28)[2016—12— 1 1]http://iphome.hhi.de/suehrlng/tm1. M,Zakaxiya S,Inamullah M.Analysis of video [14] Mozammilcompression algorithms on diferent video files[C].HW, USA:Fou ̄h International C0nferenee on Computational Intel— 参考文献 Tensor decompositions and applica 【1]Kolda T G,Bader B W. ligence and Communieation Networks(CICN),2012. Klonp S,Munderloh M,Vatis Y,et a1.Decoder—side block [15] tions[J].SIAM Review, 2009,51(8):455—500. [2] Peng Lizhong,Peng Lizhong,Zhang Fan.Compact representa— tion for dynamic texture video coding using tensor method motion estimation for H.264/MPEG一4 AVC based video coding[C].Canada:IEEE International Symposium,2009. wWw.d ¨ziReji.1]1[|