Publication: Learned image SR: advancing in modeling and generative sample selection
Program
Electrical and Electronics Engineering
KU-Authors
KU Authors
Co-Authors
Editor & Affiliation
Compiler & Affiliation
Translator
Other Contributor
Author
Advisor
YĆK Thesis ID
941822
Date on the IR
Date
Language
Type
Embargo Status
No
Journal Title
Journal ISSN
Volume Title
Alternative Title
ĆÄrenilmiÅ gƶrüntü süper Ƨƶzünürlük: modelleme ve üretici ƶrnek seƧiminde ilerleme
Abstract
Super-resolution (SR) is an ill-posed inverse problem focused on reconstructing high-resolution images from low-resolution counterparts by recovering missing details. Despite advancements, SR faces persistent challenges in generalization, balancing fidelity and perceptual quality, mitigating artifacts, and ensuring trustworthy results. This thesis tackles these issues through innovations in model architecture, loss design, and sample selection. Central to our contributions is the use of wavelet loss, which improve the ability of SR models to distinguish genuine details from artifacts. By leveraging these losses in both GAN-based and transformer-based models, we achieve enhanced fidelity and perceptual quality. Furthermore, we augment transformer architectures with convolutional non-local sparse attention blocks and wavelet-based training, delivering state-of-the-art performance across diverse datasets. For generative models, we address the challenge of selecting a single trustworthy solution from the diverse outputs generated by flow-based and diffusion-based models. We propose image fusion strategies for flow-based models to optimize the perception-distortion trade-off and introduce human-in-the-loop and vision-language model-guided approaches for selecting reliable diffusion model samples. These strategies provide scalable, automated solutions that match or surpass human assessments in generating trustworthy SR outputs. This thesis presents comprehensive advancements in SR methodologies, spanning both regressive and generative paradigms. By introducing novel frameworks and scalable solutions, it sets new benchmarks for reliability, efficiency, and visual quality in SR, with promising implications for real-world applications, including medical imaging, satellite imagery, and digital content enhancement.
Süper Ƨƶzünürlük (SĆ), düÅük Ƨƶzünürlüklü gƶrüntülerden kayıp detayları geri kazanarak yüksek Ƨƶzünürlüklü gƶrüntüler oluÅturmayı amaƧlayan, iyi tanımlanmamıŠbir ters problemdir. GeliÅmelere raÄmen, SĆ hala genelleme, algısal kaliteyi dengeleme, yapay detay ve bozulmaları azaltma ve güvenilir sonuƧlar elde etme konularında zorluklarla karÅılaÅmaktadır. Bu tez, model mimarisi, kayıp tasarımı ve ƶrnek seƧimi alanlarında yenilikƧi yaklaÅımlar sunarak bu zorlukları ele almaktadır. Katkılarımızın merkezinde, SĆ modellerinin gerƧek detayları yapay artefaktlardan ayırt etme yeteneÄini artıran dalgacık alanındaki kayıpların kullanımı yer almaktadır. Bu kayıpları hem GAN tabanlı hem de dƶnüÅtürücü (transformer) tabanlı modellerde kullanarak, algısal kaliteyi artırmayı baÅardık. Ayrıca, transformer mimarilerini evriÅimsel yerel olmayan seyrek dikkat blokları ve dalgacık tabanlı eÄitimle destekleyerek, algılama alanlarını ƶnemli ƶlçüde geniÅletiyor ve ƧeÅitli veri kümelerinde son teknoloji performansı saÄlıyoruz. Ćretici modeller iƧin, akıŠ(flow) ve yayılma (diffusion) tabanlı modellerin ürettiÄi ƧeÅitli Ƨıktılar arasından tek bir güvenilir Ƨƶzüm seƧme sorununu ele alıyoruz. AkıŠtabanlı modeller iƧin algı-bozulma dengesini optimize etmek amacıyla gƶrüntü birleÅtirme stratejileri ƶneriyor; yayılma tabanlı modeller iƧin güvenilir ƶrnekleri seƧmek adına insan geri bildirimi ve gƶrsel-dil modeli (VLM) rehberli yaklaÅımlar sunuyoruz. Bu stratejiler, güvenilir SR Ƨıktıları oluÅtururken insan deÄerlendirmeleriyle uyumlu ve hatta onları aÅabilen ƶlƧeklenebilir ve otomatik Ƨƶzümler saÄlamaktadır. Bu tez, hem regresif hem de üretici paradigmaları kapsayan SĆ metodolojilerinde kapsamlı ilerlemeler sunmaktadır. YenilikƧi ƧerƧeveler ve ƶlƧeklenebilir Ƨƶzümler sunarak, SĆ alanında güvenilirlik, verimlilik ve gƶrsel kalite iƧin yeni standartlar belirlemekte ve tıbbi gƶrüntüleme, uydu gƶrüntüleri ve dijital iƧerik geliÅtirme gibi gerƧek dünya uygulamaları iƧin umut vadeden sonuƧlar ortaya koymaktadır.
Süper Ƨƶzünürlük (SĆ), düÅük Ƨƶzünürlüklü gƶrüntülerden kayıp detayları geri kazanarak yüksek Ƨƶzünürlüklü gƶrüntüler oluÅturmayı amaƧlayan, iyi tanımlanmamıŠbir ters problemdir. GeliÅmelere raÄmen, SĆ hala genelleme, algısal kaliteyi dengeleme, yapay detay ve bozulmaları azaltma ve güvenilir sonuƧlar elde etme konularında zorluklarla karÅılaÅmaktadır. Bu tez, model mimarisi, kayıp tasarımı ve ƶrnek seƧimi alanlarında yenilikƧi yaklaÅımlar sunarak bu zorlukları ele almaktadır. Katkılarımızın merkezinde, SĆ modellerinin gerƧek detayları yapay artefaktlardan ayırt etme yeteneÄini artıran dalgacık alanındaki kayıpların kullanımı yer almaktadır. Bu kayıpları hem GAN tabanlı hem de dƶnüÅtürücü (transformer) tabanlı modellerde kullanarak, algısal kaliteyi artırmayı baÅardık. Ayrıca, transformer mimarilerini evriÅimsel yerel olmayan seyrek dikkat blokları ve dalgacık tabanlı eÄitimle destekleyerek, algılama alanlarını ƶnemli ƶlçüde geniÅletiyor ve ƧeÅitli veri kümelerinde son teknoloji performansı saÄlıyoruz. Ćretici modeller iƧin, akıŠ(flow) ve yayılma (diffusion) tabanlı modellerin ürettiÄi ƧeÅitli Ƨıktılar arasından tek bir güvenilir Ƨƶzüm seƧme sorununu ele alıyoruz. AkıŠtabanlı modeller iƧin algı-bozulma dengesini optimize etmek amacıyla gƶrüntü birleÅtirme stratejileri ƶneriyor; yayılma tabanlı modeller iƧin güvenilir ƶrnekleri seƧmek adına insan geri bildirimi ve gƶrsel-dil modeli (VLM) rehberli yaklaÅımlar sunuyoruz. Bu stratejiler, güvenilir SR Ƨıktıları oluÅtururken insan deÄerlendirmeleriyle uyumlu ve hatta onları aÅabilen ƶlƧeklenebilir ve otomatik Ƨƶzümler saÄlamaktadır. Bu tez, hem regresif hem de üretici paradigmaları kapsayan SĆ metodolojilerinde kapsamlı ilerlemeler sunmaktadır. YenilikƧi ƧerƧeveler ve ƶlƧeklenebilir Ƨƶzümler sunarak, SĆ alanında güvenilirlik, verimlilik ve gƶrsel kalite iƧin yeni standartlar belirlemekte ve tıbbi gƶrüntüleme, uydu gƶrüntüleri ve dijital iƧerik geliÅtirme gibi gerƧek dünya uygulamaları iƧin umut vadeden sonuƧlar ortaya koymaktadır.
Source
Publisher
KoƧ University
Subject
Image processing, digital techniques, Computer vision, High resolution imaging, Three-dimensional display systems, Computer-aided design, Three-dimensional printing, Artificial intelligence, Multimedia information systems, Optical data processing
Citation
Has Part
Source
Book Series Title
Edition
DOI
item.page.datauri
Link
Rights
restrictedAccess
Copyrights Note
© All Rights Reserved. Accessible to Koç University Affiliated Users Only!
