Publication: Unpaired aired image-to-image translation with learnable tookens in diffusionGAN
Program
Computer Sciences and Engineering
KU-Authors
KU Authors
Co-Authors
Authors
Advisor
YĆK Thesis ID
925852
Approval Date
Publication Date
Language
Type
Embargo Status
No
Journal Title
Journal ISSN
Volume Title
Alternative Title
DiffusionGAN ile ƶÄrenebilir belirteƧler kullanarak eÅleÅtirilmemiÅ gƶrüntü dƶnüÅümü
Abstract
Stable Diffusion models have recently achieved outstanding results in image generation tasks, surpassing prior state-of-the-art models based on Generative Adversarial Networks (GANs). While GANs were computationally efficient, their training stability often posed challenges. We introduce a novel framework that seeks to combine the strengths of both Stable Diffusion and GAN architectures for unpaired image-to-image translation. Our approach avoids the need for training Stable Diffusion from scratch by using pretrained token embeddings and a discriminator within a GAN-like training paradigm. This eliminates the requirement for pre-specified text prompts, as the framework learns suitable prompts through embeddings to perform domain-to-domain translation in an unsupervised setting. We show high-quality images generated by our framework and discuss promising possible ways for future enhancements.
Kararlı Difüzyon modelleri (Stable Diffusion) , gƶrüntü sentezi alanında ƶnemli bir dƶnüm noktası oluÅturarak, daha ƶnce Ćretken RekabetƧi AÄlar (GAN) tarafından elde edilen sonuƧları geride bırakmıÅtır. GAN'ların eÄitim sürecindeki istikrarsızlık sorunları, Kararlı Difüzyon'un daha etkili bir alternatif olmasını saÄlamıÅtır. Bu ƧalıÅmada, gƶrüntüden gƶrüntüye Ƨeviri iƧin hem Kararlı Difüzyon'un güçlü yƶnlerini hem de GAN'ların eÄitim paradigmasını bir araya getiren yeni bir mimari ƶnermekteyiz. Ćnerilen yeni model, ƶnceden eÄitilmiÅ Kararlı Difüzyon modelini kullanarak, metin belirteƧleri ve bir ayırıcı (Discriminator) sayesinde sıfırdan eÄitim gerektirmeden, farklı uzaylar arasında dƶnüÅüm yapabilmektedir. Bu durum, ƶnceden belirlenmiÅ metin istemlerine olan ihtiyacı ortadan kaldırmakta ve model, denetimsiz bir ortamda daha esnek bir Åekilde ƶÄrenme yeteneÄi kazanmaktadır. Tezimizde, modelin ürettiÄi yüksek kaliteli gƶrüntülerle birlikte, gelecekteki ƧalıÅmalar iƧin potansiyel iyileÅtirme alanlarını tartıÅıyoruz.
Kararlı Difüzyon modelleri (Stable Diffusion) , gƶrüntü sentezi alanında ƶnemli bir dƶnüm noktası oluÅturarak, daha ƶnce Ćretken RekabetƧi AÄlar (GAN) tarafından elde edilen sonuƧları geride bırakmıÅtır. GAN'ların eÄitim sürecindeki istikrarsızlık sorunları, Kararlı Difüzyon'un daha etkili bir alternatif olmasını saÄlamıÅtır. Bu ƧalıÅmada, gƶrüntüden gƶrüntüye Ƨeviri iƧin hem Kararlı Difüzyon'un güçlü yƶnlerini hem de GAN'ların eÄitim paradigmasını bir araya getiren yeni bir mimari ƶnermekteyiz. Ćnerilen yeni model, ƶnceden eÄitilmiÅ Kararlı Difüzyon modelini kullanarak, metin belirteƧleri ve bir ayırıcı (Discriminator) sayesinde sıfırdan eÄitim gerektirmeden, farklı uzaylar arasında dƶnüÅüm yapabilmektedir. Bu durum, ƶnceden belirlenmiÅ metin istemlerine olan ihtiyacı ortadan kaldırmakta ve model, denetimsiz bir ortamda daha esnek bir Åekilde ƶÄrenme yeteneÄi kazanmaktadır. Tezimizde, modelin ürettiÄi yüksek kaliteli gƶrüntülerle birlikte, gelecekteki ƧalıÅmalar iƧin potansiyel iyileÅtirme alanlarını tartıÅıyoruz.
Source
Publisher
KoƧ University
Subject
Mathematical models, Fluids, Fluid mechanics, Computer simulation, Artificial intelligence, Image processing, Digital techniques, Image processing, Computer vision
Citation
Has Part
Source
Book Series Title
Edition
DOI
item.page.datauri
Link
Rights
restrictedAccess
Copyrights Note
© All Rights Reserved. Accessible to Koç University Affiliated Users Only!