一种基于图神经网络和统计分析的VVC帧内编码快速算法

多功能视频编码(versatile video coding, VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree, QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit, CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快...

Full description

Saved in:
Bibliographic Details
Published in电信科学 Vol. 40; no. 9; pp. 109 - 122
Main Authors 黎天送, 刘昊坤, 崔少国, 刘姝岑, 陈艳, 王鸿奎
Format Journal Article
LanguageChinese
Published 中国通信学会 20.09.2024
人民邮电出版社有限公司
重庆师范大学,重庆 401331%杭州电子科技大学,浙江 杭州 310018
Subjects
Online AccessGet full text
ISSN1000-0801
DOI10.11959/j.issn.1000-0801.2024213

Cover

More Information
Summary:多功能视频编码(versatile video coding, VVC)作为最新一代的视频编码标准,通过引入多种高效的编码工具进一步提升了视频编码性能。然而,VVC标准引入了四叉树加多类型树(quadtree plus multi-type tree, QTMT)划分结构,并将帧内预测模式从35种扩展到67种,导致编码复杂度急剧上升。为降低VVC的帧内编码复杂度,首先,提出了一种基于图神经网络的帧内编码单元(coding unit, CU)划分快速算法,该算法利用高效的图神经网络模型直接预测CU的最优划分模式,从而跳过冗余的CU划分遍历。其次,提出了一种基于空间相关性和纹理特征的帧内模式选择快速算法,该算法利用平均方向方差和Sobel梯度算子确定纹理方向,并跳过部分角度预测模式,同时结合预测模式间的相关性精简率失真模式列表。实验结果表明,该算法能够在BDBR(bjontegaard delta bit rate)上升2.29%的代价下,节省64.04%的编码时间。
ISSN:1000-0801
DOI:10.11959/j.issn.1000-0801.2024213