RTX 3060显卡在Ubuntu 20.04上复现monodepth2：保姆级环境配置与避坑指南

张

张建站

2026/5/8 14:13:17

10分钟阅读

RTX 3060显卡在Ubuntu 20.04上复现monodepth2保姆级环境配置与避坑指南深度估计是计算机视觉领域的重要研究方向而monodepth2作为经典的自监督深度估计算法因其出色的性能和开源特性广受研究者青睐。然而当我们将这一算法迁移到新一代硬件平台时往往会遇到各种兼容性问题。本文将聚焦于RTX 3060显卡与Ubuntu 20.04系统的组合详细解析如何高效复现monodepth2模型特别针对Ampere架构显卡特有的兼容性挑战提供解决方案。1. 环境准备从驱动到依赖的全栈配置1.1 显卡驱动与CUDA工具链安装RTX 3060基于NVIDIA的Ampere架构需要特定版本的驱动支持。以下是经过验证的配置方案# 添加官方显卡驱动PPA sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update # 安装推荐驱动版本注意根据内核版本可能需要先安装dkms sudo apt install nvidia-driver-470安装完成后验证驱动状态nvidia-smi预期输出应显示驱动版本和GPU信息。接下来安装CUDA 11.4工具包这是支持Ampere架构的最低要求wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run sudo sh cuda_11.4.0_470.42.01_linux.run提示安装时务必取消勾选驱动安装选项避免与已安装驱动冲突配置环境变量echo export PATH/usr/local/cuda-11.4/bin:$PATH ~/.bashrc echo export LD_LIBRARY_PATH/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH ~/.bashrc source ~/.bashrc1.2 cuDNN与系统级依赖下载匹配的cuDNN 8.2.4需NVIDIA开发者账号然后执行tar -xzvf cudnn-11.4-linux-x64-v8.2.4.15.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod ar /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*系统级依赖安装sudo apt install build-essential cmake git libgtk2.0-dev pkg-config libavcodec-dev \ libavformat-dev libswscale-dev python3-dev python3-numpy libtbb2 libtbb-dev \ libjpeg-dev libpng-dev libtiff-dev libdc1394-22-dev2. Python环境构建与PyTorch适配2.1 Conda环境配置创建专用环境建议使用Python 3.8作为平衡点conda create -n monodepth2 python3.8 conda activate monodepth2PyTorch安装需要特别注意版本匹配conda install pytorch1.9.0 torchvision0.10.0 torchaudio0.9.0 cudatoolkit11.3 -c pytorch验证PyTorch能否识别GPUimport torch print(torch.cuda.is_available()) # 应返回True print(torch.cuda.get_device_name(0)) # 应显示RTX 30602.2 依赖项精确控制monodepth2对特定库版本敏感建议按以下顺序安装pip install numpy1.19.5 opencv-python4.5.1.48 pillow8.3.2 pip install scipy1.7.0 matplotlib3.4.2 tensorboardX2.4对于可能出现的冲突可使用以下命令检查依赖关系pipdeptree --warn silence | grep -E torch|numpy|opencv3. monodepth2源码适配与修改3.1 源码获取与结构调整克隆官方仓库并进行必要修改git clone https://github.com/nianticlabs/monodepth2.git cd monodepth2关键修改点数据集加载适配修改datasets/mono_dataset.py中的图像加载逻辑def pil_loader(path): if not os.path.exists(path): if .jpg in path: path path.replace(.jpg, .png) elif .png in path: path path.replace(.png, .jpg) with open(path, rb) as f: with Image.open(f) as img: return img.convert(RGB)颜色增强修正同一文件中找到color_aug相关代码修改为color_aug transforms.ColorJitter( self.brightness, self.contrast, self.saturation, self.hue)3.2 训练参数调整针对RTX 3060的12GB显存建议调整train.py中的默认参数# 修改batch size参数 parser.add_argument(--batch_size, typeint, helpbatch size, default8) # 调整图像分辨率根据显存情况 parser.add_argument(--height, typeint, helpinput image height, default320) parser.add_argument(--width, typeint, helpinput image width, default1024)4. 实战测试与性能优化4.1 单图像推理测试准备测试图像并运行python test_simple.py --image_path assets/test_image.jpg \ --model_name monostereo_640x192 \ --ext png常见问题处理CUDA kernel错误若出现no kernel image is available for execution错误表明PyTorch版本与显卡架构不匹配。解决方案conda install pytorch1.10.0 torchvision0.11.0 torchaudio0.10.0 cudatoolkit11.3 -c pytorch内存不足问题修改evaluate_depth.py中的评估批次大小parser.add_argument(--batch_size, typeint, default4, helpevaluation batch size)4.2 完整训练流程KITTI数据集预处理python prepare_train_data.py --data_path kitti_data \ --split eigen_zhou --height 320 --width 1024启动训练建议使用screen/tmuxpython train.py --model_name mono_model \ --data_path kitti_data \ --log_dir ./logs \ --height 320 --width 1024 \ --batch_size 8 \ --num_epochs 20训练过程监控tensorboard --logdir./logs4.3 性能调优技巧混合精度训练修改train.py添加以下代码scaler torch.cuda.amp.GradScaler() with torch.cuda.amp.autocast(): outputs model(inputs) losses criterion(outputs) scaler.scale(losses[loss]).backward() scaler.step(optimizer) scaler.update()数据加载优化设置合适的worker数量通常为CPU核心数的2-4倍train_loader DataLoader( train_dataset, batch_sizeargs.batch_size, shuffleTrue, num_workers8, pin_memoryTrue, drop_lastTrue)显存使用监控添加显存日志记录print(fMemory allocated: {torch.cuda.memory_allocated()/1024**2:.2f}MB) print(fMemory cached: {torch.cuda.memory_reserved()/1024**2:.2f}MB)5. 高级调试与问题排查5.1 常见错误解决方案错误类型典型表现解决方案CUDA兼容性sm_86 not supported升级PyTorch到1.9CUDA到11.3cuDNN错误CUDNN_STATUS_EXECUTION_FAILED检查cuDNN版本匹配重装对应版本内存不足CUDA out of memory减小batch size关闭不需要的进程数据加载Worker exited unexpectedly减少num_workers检查数据路径5.2 性能瓶颈分析使用NVIDIA Nsight Systems进行性能分析nsys profile --statstrue python train.py --model_name profile_run ...关键指标关注点GPU利用率应保持在80%以上内核执行时间分布内存拷贝开销5.3 模型精度验证建立基准测试集python evaluate_depth.py --load_weights_folder ./models/monostereo_640x192 \ --eval_stereo --data_path kitti_data --eval_split eigen_benchmark预期输出指标参考abs_rel | sq_rel | rmse | a1 | a2 | a3 0.115 | 0.903 | 4.863| 0.877 | 0.960 | 0.981

微软展示统一 Xbox 用户界面，解决多设备体验碎片化难题

Xbox 统一 UI 初亮相在 3 月的游戏开发者大会上，微软展示了适用于手持设备、游戏机和云游戏的“统一”Xbox 用户界面（UI）。当时从活动期间资料难以看出新意，如今新视频让我们能更近距离了解它。解决体验碎片化痛点Xbox 下一代业务…...

2026/5/8 14:12:41 阅读更多 →

如何永久保存微信聊天记录：WeChatMsg让你的数字记忆永不消逝

如何永久保存微信聊天记录：WeChatMsg让你的数字记忆永不消逝【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we…...

2026/5/8 14:12:39 阅读更多 →

告别命令行：用VNC+树莓派打造你的轻量级家庭服务器（Raspberry Pi OS Bullseye）

告别命令行：用VNC树莓派打造你的轻量级家庭服务器（Raspberry Pi OS Bullseye） 将树莓派改造成24小时运行的家庭服务器，是许多技术爱好者的共同选择。无论是作为下载机、智能家居中枢还是媒体服务器，这个小巧的设备都能…...

2026/5/8 14:11:04 阅读更多 →

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南

Zotero重复文献终极处理方案：ZoteroDuplicatesMerger完整使用指南【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 如果你正在为Zot…...

2026/5/7 22:07:22 阅读更多 →