《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 復雜景觀圖像的語義多狀態圖像風格遷移
復雜景觀圖像的語義多狀態圖像風格遷移
電子技術應用
桑晨浩,莫路鋒,屠國青
浙江農林大學 數學與計算機科學學院
摘要: 復雜景觀圖像包含具有不同特征的各種對象,傳統的風格遷移方法無法在同一圖像中對不同對象進行局部風格遷移。CycleGAN可以通過偽監督策略在沒有配對樣本的情況下實現風格遷移。但是CycleGAN無法實現對復雜風景圖像中不同類別對象的風格遷移;同時CycleGAN在復雜場景中的泛化能力不足且復雜度高。因此,提出了一種基于語義類別的復雜風景多狀態圖像生成方法,即語義類別風格遷移(Semantic Category Style Transfer,SCST),能夠有效地結合局部特征實現復雜風景的圖像生成。同時提出了上下文感知的風格遷移模型GCycleGAN。實驗結果表明本文提出的GCycleGAN的性能優于CycleGAN、DualGAN和Munit等基于深度學習的圖像生成模型。
中圖分類號:TP389.1 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.245971
中文引用格式: 桑晨浩,莫路鋒,屠國青. 復雜景觀圖像的語義多狀態圖像風格遷移[J]. 電子技術應用,2025,51(6):40-46.
英文引用格式: Sang Chenhao,Mo Lufeng,Tu Guoqing. Multi-state image generation of complex landscapes via semantic category style transfer[J]. Application of Electronic Technique,2025,51(6):40-46.
Multi-state image generation of complex landscapes via semantic category style transfer
Sang Chenhao,Mo Lufeng,Tu Guoqing
College of Mathematics and Computer Science, Zhejiang Agricultural and Forest University
Abstract: Complex landscape images contain various objects with different characteristics, and traditional style transfer methods are unable to perform local style transfer on different objects within the same image. CycleGAN can achieve style transfer without paired samples through a pseudo-supervised strategy. However, CycleGAN fails to transfer styles between different categories of objects in complex landscape images; moreover, it lacks generalization ability in complex scenes and has high complexity. Therefore, this paper proposes a method for generating complex landscape multi-state images based on semantic categories, namely Semantic Category Style Transfer (SCST), which effectively combines local features for the generation of complex landscape images. Additionally, this paper introduces a context-aware style transfer model called GCycleGAN. Experimental results show that the performance of the proposed GCycleGAN is superior to that of deep learning-based image generation models such as CycleGAN, DualGAN, and Munit.
Key words : landscape;local style transfer;SCST;CycleGAN;Gated-MLP;image generation

引言

圖像風格遷移(IST)是圖像生成領域的一個熱門研究主題[1],可應用于城市規劃、景觀設計、文化藝術等領域。其目的是將X領域中的風景圖像轉移到Y領域。因此,各種IST研究相繼應用于景觀設計[2]。語義分割與 CycleGAN 的結合最近已成為景觀圖像局部風格遷移的主流,旨在轉移景觀圖像中特定對象的風格。Kurzman 等人[3]設計了一種兩階段局部遷移模型,實現了城市街道中真實圖像與地面物體的流行藝術之間的局部風格遷移。Duan 等人[4]使用手工制作的語義分割和 CycleGAN,將城市景觀圖像中交通標志的紋理風格進行遷移。Kim 等人[5]利用 CycleGAN 和語義掩膜,將真實景觀圖像中的對象轉換為動漫風格。但是,CycleGAN用于復雜景觀的多狀態圖像生成仍存在兩方面的不足。首先,它的圖像上下文感知能力還有待進一步提升。盡管文獻[6]和文獻[7]探索了Vision Transformer通過self -attention捕獲景觀圖像上下文信息的有效性,但該方法參數量較大,容易過擬合,且難以訓練[8]。其次,其無法針對圖像中不同對象分別進行風格轉換,例如,不同的樹種在不同季節的風格轉換中有不同的表現。這使得CycleGAN無法很好地應用于復雜景觀圖像的風格遷移和多狀態的圖像生成。

針對以上兩個方面的問題,本文提出一種基于語義類別風格遷移的復雜景觀的多狀態圖像生成方法SCST(Semantic Category Style Transfer),根據復雜景觀圖像中不同語義類別的特征,實現對各個語義類別區域的局域風格遷移。在SCST中,首先通過語義分割確定復雜景觀圖像中各個區域的語義類別。然后按照各個語義類別所代表對象在目標狀態下的變化特征,采用改進的具有上下感知的風格遷移模型GCycleGAN對各個語義類別區域分別進行風格遷移。GCycleGAN通過在CycleGAN的生成器與判別器的主干特征提取網絡引入更輕量的Gated-MLP[9],降低參數量和模型復雜度的同時加快訓練收斂速度,通過全局信息與局部信息的融合,提高處理信息的效率和準確性,從而訓練出更加準確的生成模型。最后結合語義分割結果,將風格遷移后的各個區域融合到一起,得到最終的全局風格遷移的目標狀態景觀圖像。


本文詳細內容請下載:

http://www.xxav2194.com/resource/share/2000006560


作者信息:

桑晨浩,莫路鋒,屠國青

(浙江農林大學 數學與計算機科學學院,浙江 杭州 311300)


Magazine.Subscription.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 全彩口工番日本漫画| 日韩国产成人精品视频| 国产精品国产亚洲精品看不卡| 亚洲一区二区三区影院| 黄网址在线观看| 无敌小保子笔趣阁| 亚洲女人初试黑人巨高清| 韩日视频在线观看| 好男人www视频| 亚洲乱码中文字幕综合| 精品久久久久久无码人妻| 国产婷婷综合在线视频| 一级做a爰片性色毛片16美国| 欧美综合一区二区三区| 国产在线国偷精品产拍| а√最新版在线天堂| 欧美人与性动交α欧美精品 | 国产精品国产三级国快看| 一级做α爱**毛片| 日本道色综合久久影院| 亚洲国产婷婷六月丁香| 色综合色综合久久综合频道| 女让张开腿让男人桶视频| 亚洲国产成人久久精品软件| 精品中文字幕在线观看| 国产精品va在线播放| 中文字幕日本最新乱码视频| 永久免费AV无码网站性色AV| 国产孕妇做受视频在线观看| 91在线激情在线观看| 日本三级免费看| 亚洲精品中文字幕无码AV| 黄页网址在线观看| 好吊色青青青国产在线观看| 久久国产精品成人片免费| 男人j进女人p免费视频不要下载的| 国产福利兔女郎在线观看| 三级伦理在线播放| 欧美三级不卡在线观看| 午夜福利一区二区三区高清视频| 91九色视频无限观看免费|