End-to-end rate-distortion optimization for bi-directional learned video compression

Publication:
End-to-end rate-distortion optimization for bi-directional learned video compression

dc.contributor.department	Department of Electrical and Electronics Engineering
dc.contributor.kuauthor	Tekalp, Ahmet Murat
dc.contributor.kuauthor	Yılmaz, Melih
dc.contributor.schoolcollegeinstitute	College of Engineering
dc.date.accessioned	2024-11-09T13:47:24Z
dc.date.issued	2020
dc.description.abstract	Conventional video compression methods employ a linear transform and block motion model, and the steps of motion estimation, mode and quantization parameter selection, and entropy coding are optimized individually due to combinatorial nature of the end-to-end optimization problem. Learned video compression allows end-to-end rate-distortion optimized training of all nonlinear modules, quantization parameter and entropy model simultaneously. While previous work on learned video compression considered training a sequential video codec based on end-to-end optimization of cost averaged over pairs of successive frames, it is well-known in conventional video compression that hierarchical, bi-directional coding outperforms sequential compression. In this paper, we propose for the first time end-to-end optimization of a hierarchical, bi-directional motion compensated learned codec by accumulating cost function over fixed-size groups of pictures (GOP). Experimental results show that the rate-distortion performance of our proposed learned bi-directional GOP coder outperforms the state-of-the-art end-to-end optimized learned sequential compression as expected.
dc.description.fulltext	YES
dc.description.indexedby	Scopus
dc.description.openaccess	YES
dc.description.publisherscope	International
dc.description.sponsoredbyTubitakEu	TÜBİTAK
dc.description.sponsorship	Scientific and Technological Research Council of Turkey (TÜBİTAK)
dc.description.sponsorship	Turkish Academy of Sciences (TUBA)
dc.description.version	Author's final manuscript
dc.identifier.doi	10.1109/ICIP40778.2020.9190881
dc.identifier.eissn	2381-8549
dc.identifier.embargo	NO
dc.identifier.filenameinventoryno	IR02689
dc.identifier.isbn	9781728163956
dc.identifier.issn	1522-4880
dc.identifier.quartile	N/A
dc.identifier.scopus	2-s2.0-85098622360
dc.identifier.uri	https://hdl.handle.net/20.500.14288/3765
dc.keywords	Bi-directional motion compensation
dc.keywords	Deep learning
dc.keywords	End-to-end optimization
dc.keywords	Group of pictures
dc.keywords	Video compression
dc.language.iso	eng
dc.publisher	Institute of Electrical and Electronics Engineers (IEEE)
dc.relation.grantno	2.17E+35
dc.relation.ispartof	2020 IEEE International Conference on Image Processing (ICIP)
dc.relation.uri	http://cdm21054.contentdm.oclc.org/cdm/ref/collection/IR/id/9335
dc.subject	Image compression
dc.title	End-to-end rate-distortion optimization for bi-directional learned video compression
dc.type	Conference Proceeding
dspace.entity.type	Publication
local.contributor.kuauthor	Yılmaz, Melih
local.contributor.kuauthor	Tekalp, Ahmet Murat
local.publication.orgunit1	College of Engineering
local.publication.orgunit2	Department of Electrical and Electronics Engineering
relation.isOrgUnitOfPublication	21598063-a7c5-420d-91ba-0cc9b2db0ea0
relation.isOrgUnitOfPublication.latestForDiscovery	21598063-a7c5-420d-91ba-0cc9b2db0ea0
relation.isParentOrgUnitOfPublication	8e756b23-2d4a-4ce8-b1b3-62c794a8c164
relation.isParentOrgUnitOfPublication.latestForDiscovery	8e756b23-2d4a-4ce8-b1b3-62c794a8c164

Files

Original bundle

Now showing 1 - 1 of 1

Name:: 9335.pdf
Size:: 1.62 MB
Format:: Adobe Portable Document Format

Download

Collections

Publications with Fulltext

Publication: End-to-end rate-distortion optimization for bi-directional learned video compression

Files

Original bundle

Collections

Publication:
End-to-end rate-distortion optimization for bi-directional learned video compression