跳至主要內容

SwinFusion: Cross-domain Long-range Learning for General Image Fusion

小李同学小于 1 分钟论文阅读

FusionGAN 同一作者

Source

项目源码地址:https://github.com/Linfeng-Tang/SwinFusion 数据集也是红外和可见光影像数据

论文解读

  • 核心思想

基于CNN和Swin Transformer来提取包含局部信息和全局信息的特征并将这些特征进行域内和跨域融合的方法。

  • 总体架构
  1. 特征提取:CNN + Swin Transformer shallow features Extraction 包含两个卷积层,其内核大小为3 X 3,步长为1,该层用于提取浅层特征。 Deep Feature Extraction 包含 4 个 Swin Transformer 层,在 shallow features Extraction 层的基础上,提取包含全局信息的特征。

  2. 特征融合:基于 Swin Transformer 的跨域融合和域内信息提取

  3. 图像重建