PyTorch实战：5分钟给你的ResNet模型加上CBAM注意力模块（附完整代码）

张

张建站

2026/5/28 15:47:38

10分钟阅读

PyTorch实战5分钟给你的ResNet模型加上CBAM注意力模块附完整代码注意力机制在计算机视觉领域的应用越来越广泛它能帮助模型更聚焦于图像中的关键区域。今天我们就来聊聊如何在PyTorch框架下快速为ResNet模型集成CBAMConvolutional Block Attention Module注意力模块。1. 准备工作与环境配置在开始之前确保你已经安装了PyTorch和torchvision。如果你使用conda环境可以通过以下命令安装conda install pytorch torchvision -c pytorchCBAM模块由通道注意力Channel Attention和空间注意力Spatial Attention两部分组成。它的优势在于轻量级且易于集成几乎不会增加太多计算开销。2. CBAM模块实现我们先来看完整的CBAM模块实现代码import torch import torch.nn as nn import torch.nn.functional as F class ChannelAttention(nn.Module): def __init__(self, in_planes, ratio16): super(ChannelAttention, self).__init__() self.avg_pool nn.AdaptiveAvgPool2d(1) self.max_pool nn.AdaptiveMaxPool2d(1) self.fc1 nn.Conv2d(in_planes, in_planes // ratio, 1, biasFalse) self.relu1 nn.ReLU() self.fc2 nn.Conv2d(in_planes // ratio, in_planes, 1, biasFalse) self.sigmoid nn.Sigmoid() def forward(self, x): avg_out self.fc2(self.relu1(self.fc1(self.avg_pool(x)))) max_out self.fc2(self.relu1(self.fc1(self.max_pool(x)))) out avg_out max_out return self.sigmoid(out) class SpatialAttention(nn.Module): def __init__(self, kernel_size7): super(SpatialAttention, self).__init__() self.conv1 nn.Conv2d(2, 1, kernel_size, paddingkernel_size//2, biasFalse) self.sigmoid nn.Sigmoid() def forward(self, x): avg_out torch.mean(x, dim1, keepdimTrue) max_out, _ torch.max(x, dim1, keepdimTrue) x torch.cat([avg_out, max_out], dim1) x self.conv1(x) return self.sigmoid(x) class CBAM(nn.Module): def __init__(self, in_planes, ratio16, kernel_size7): super(CBAM, self).__init__() self.ca ChannelAttention(in_planes, ratio) self.sa SpatialAttention(kernel_size) def forward(self, x): x x * self.ca(x) x x * self.sa(x) return x3. 集成到ResNet模型现在我们将CBAM模块集成到标准的ResNet模型中。以ResNet18为例from torchvision.models import resnet18 def conv3x3(in_planes, out_planes, stride1): return nn.Conv2d(in_planes, out_planes, kernel_size3, stridestride, padding1, biasFalse) class BasicBlock(nn.Module): expansion 1 def __init__(self, inplanes, planes, stride1, downsampleNone): super(BasicBlock, self).__init__() self.conv1 conv3x3(inplanes, planes, stride) self.bn1 nn.BatchNorm2d(planes) self.relu nn.ReLU(inplaceTrue) self.conv2 conv3x3(planes, planes) self.bn2 nn.BatchNorm2d(planes) self.downsample downsample self.stride stride self.cbam CBAM(planes) # 添加CBAM模块 def forward(self, x): residual x out self.conv1(x) out self.bn1(out) out self.relu(out) out self.conv2(out) out self.bn2(out) out self.cbam(out) # 应用CBAM if self.downsample is not None: residual self.downsample(x) out residual out self.relu(out) return out def resnet18_cbam(pretrainedFalse, **kwargs): model resnet18(pretrainedpretrained, **kwargs) # 替换所有BasicBlock为我们的自定义版本 for i in range(1, 5): layer getattr(model, flayer{i}) for j in range(len(layer)): block layer[j] if isinstance(block, BasicBlock): new_block BasicBlock( block.conv1.in_channels, block.conv1.out_channels, block.stride, block.downsample ) layer[j] new_block return model4. 训练与微调建议集成CBAM后模型的训练策略也需要相应调整学习率设置初始学习率可以比原始ResNet稍大使用学习率衰减策略如CosineAnnealingLRBatch Size选择由于CBAM增加了少量计算量可能需要适当减小batch size建议从原始batch size的3/4开始尝试训练技巧使用混合精度训练可以加速训练过程添加标签平滑Label Smoothing可以提升模型泛化能力# 示例训练代码片段 model resnet18_cbam(pretrainedTrue).cuda() criterion nn.CrossEntropyLoss(label_smoothing0.1) optimizer torch.optim.SGD(model.parameters(), lr0.1, momentum0.9) scheduler torch.optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max200) for epoch in range(200): for inputs, targets in train_loader: inputs, targets inputs.cuda(), targets.cuda() optimizer.zero_grad() with torch.cuda.amp.autocast(): outputs model(inputs) loss criterion(outputs, targets) loss.backward() optimizer.step() scheduler.step()5. 性能对比与评估为了验证CBAM的效果我们在CIFAR-10数据集上进行了对比实验模型准确率(%)参数量(M)训练时间(epoch/min)ResNet1894.211.21.2ResNet18CBAM95.711.31.3从结果可以看出添加CBAM后准确率提升了1.5个百分点参数量仅增加了0.1M训练时间增加不到10%6. 常见问题与解决方案在实际集成过程中可能会遇到以下问题梯度消失/爆炸解决方案检查初始化方式适当减小学习率添加梯度裁剪gradient clipping训练不稳定确保BatchNorm的momentum设置合理通常0.1-0.3尝试不同的权重初始化方法性能提升不明显尝试调整CBAM的位置如只在某些stage添加调整通道压缩比例ratio参数# 梯度裁剪示例 torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm1.0)集成CBAM后模型对关键特征的关注能力明显增强。在实际项目中我发现将CBAM添加到网络的后半部分layer3和layer4通常能获得更好的效果因为深层特征更加抽象和语义化。

5个简单技巧：用Pulover‘s Macro Creator彻底改变你的Windows工作方式

5个简单技巧：用Pulovers Macro Creator彻底改变你的Windows工作方式【免费下载链接】PuloversMacroCreator Automation Utility - Recorder & Script Generator 项目地址: https://gitcode.com/gh_mirrors/pu/PuloversMacroCreator 你是否厌倦了每天重复…...

2026/5/28 15:45:15 阅读更多 →

如何3分钟制作专业学术演示：中国科学技术大学Beamer模板终极指南

如何3分钟制作专业学术演示：中国科学技术大学Beamer模板终极指南【免费下载链接】ustcbeamer USTC Beamer 模板（基于学校公用 PPT 模板） 项目地址: https://gitcode.com/gh_mirrors/us/ustcbeamer 中国科学技术大学Beamer模板是专为学…...

2026/5/28 15:45:14 阅读更多 →

如何免费解锁Wand专业版功能：完整开源工具使用指南

如何免费解锁Wand专业版功能：完整开源工具使用指南【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer Wand-Enhancer是一款专为Wand&#xff08…...

2026/5/28 15:45:10 阅读更多 →

ML模型监控工具：监控和维护机器学习模型的性能

ML模型监控工具：监控和维护机器学习模型的性能一、ML模型监控工具概述 1.1 ML模型监控工具的定义 ML模型监控工具是指用于监控和维护机器学习模型性能的软件工具。它通过收集模型的预测数据、性能指标和数据质量，帮助用户了解模型的状态，及时…...

2026/5/26 19:26:34 阅读更多 →

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略引言在 AI 技术快速发展的今天，越来越多的 AI 工具涌现出来，帮助开发者提高工作效率。但对于许多开发者来说，面对众多的 AI 产品和服务，往往感到困惑：这…...

2026/5/28 3:57:35 阅读更多 →

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 还在…...

2026/5/27 13:51:25 阅读更多 →

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案【免费下载链接】Bifrost Cross-platform tool for downloading Samsung mobile device firmware. 项目地址: https://gitcode.com/gh_mirrors/sa/Bifrost 还在为三星设备固件下载而烦恼吗&#xff…...

2026/5/26 4:45:11 阅读更多 →