当前位置: 首页 > news >正文

docker 容器化部署 vLLM 启动大模型

环境:centos 8.x、显卡L20 46Gx 5块

1、安装好NVIDIA Container Toolkit组件

      参考我上一篇文件中的3.1:安装nvidia容器支持,链接 https://www.cnblogs.com/zhaolongisme/p/18912077

2、下载vLLM镜像和大模型文件

# 拉取vLLM最新版本镜像
docker pull vllm/vllm-openai:latest

       模型下载地址: https://hf-mirror.com/Qwen

3、启动容器脚本

# vLLM容器化启动脚本
#! /bin/bash
docker stop my_vllm_container && docker rm my_vllm_containerdocker run -d  --runtime nvidia --gpus all \--name my_vllm_container \--env "HUGGING_FACE_HUB_TOKEN=<secret>" \-v /data/vLLM/huggingface/Qwen/Qwen3-4B-Instruct-2507:/models/Qwen3-4B-Instruct-2507 \-p 11434:8000 \--ipc=host \vllm/vllm-openai:latest \--model /models/Qwen3-4B-Instruct-2507 \   #指定引用的模型--tensor-parallel-size 4 \    #启动4块--gpu-memory-utilization 0.15 \   #允许使用GPU的百分比--max-model-len 12048    #长度
#  --kv-cache-dtype fp8  #引用此参数会使vLLM版本降低使用# 查看容器日志
docker logs -f my_vllm_container  

4、# 通过curl调用API接口:

curl -X POST "http://111.202.106.174:11434/v1/chat/completions" \
        -H "Content-Type: application/json" \
        --data '{
                "model": "/models/Qwen3-4B-Instruct-2507",
                "messages": [
                        {
                                "role": "user",
                                "content": "天空为什么是蓝色的?"
                        }
                ]
        }'

 

http://www.aitangshan.cn/news/554.html

相关文章:

  • App Linking 助力应用场景创新,操作步骤立省 60%
  • ChatGpt 5系列文章1——编码与智能体
  • Cisco Catalyst 9800-CL IOS XE 17.18.1 发布,新增功能简介
  • Cisco Modeling Labs (CML) 2.9.0 - 网络仿真工具
  • Omnissa App Volumes 4, version 2506 - 实时应用程序交付系统
  • Omnissa Dynamic Environment Manager 2506 - 个性化动态 Windows 桌面环境管理
  • AES 加密模式演进:从 ECB、CBC 到 GCM 的 C# 深度实践
  • Cisco Catalyst 9800 WLC IOS XE 17.18.1 发布,新增功能简介
  • 详细介绍:python办自动化--读取邮箱中特定的邮件,并下载特定的附件
  • 微软开源的 MCP 教程「GitHub 热点速览」
  • 题解:qoj10322 Matching Query
  • ZR Summer 2025 CD ACM暨 ZR Summer 2025 C 游记
  • flutter flutter_inappwebview插件里js上传调用相机和图库碰到的问题
  • ruoyi-cloud微服务docker部署
  • #dp#L 最多变的序列
  • idea系列问题
  • Infoblox推出革命性高级威胁防御方案,通过DNS层防护主动抵御AI驱动的复杂攻击
  • 电商交易-履约-库存中心业务模型设计
  • pyyzDay8
  • 基于OAuth2与JWT的微服务API安全实战经验分享 - 实践
  • 文件或文件夹访问被拒绝,文件没有权限: 1.gpedit.msc--WINDOWS设置--安全设置--安全选项--用户帐户控制:以管理员批准模式运行所有管理员---已启用
  • 那快把题端上来吧(三)
  • 时变特征场景下的主动特征获取方法评估
  • (势能线段树)SPOJ GSS4/洛谷 P4145 上帝造题7分钟/P7334 吊打 题解
  • 6.3.3 狄利克雷卷积
  • 6.3.1常见积性函数
  • 一些 DS 题目
  • 虚弱相关-【改错】-下
  • 这一次,国产全自研高性能图形GPU真的来了
  • 一文彻底讲透:AI大模型应用架构全解析