Ollama + ModelScope：本地大模型极简部署

张

张建站

2026/4/21 1:07:15

10分钟阅读

核心目标帮你用最短时间在本地跑通大模型并选对部署工具。适用人群个人开发者、学生党、AI应用入门者。一、Ollama一条命令搞定本地大模型1.1 是什么Ollama 是一个开箱即用的大模型本地运行框架封装了底层推理引擎llama.cpp支持 macOS / Windows / Linux / Docker。1.2 安装与常用命令安装Linuxcurl -fsSL https://ollama.com/install.sh | bashDocker 方式curl -fsSL https://ollama.com/install.sh | bash常用命令ollama run 模型名 # 下载并运行模型 ollama list # 查看已安装模型 ollama rm 模型名 # 删除模型1.3 一键运行 ModelScope 模型直接拉取魔搭社区的 GGUF 模型ollama run modelscope.cn/Qwen/Qwen2.5-3B-Instruct-GGUF ollama run modelscope.cn/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF二、调用大模型接口2.1 Python 调用OpenAI 兼容风格from openai import OpenAI client OpenAI( base_urlhttp://localhost:11434/v1, api_keyollama ) response client.chat.completions.create( modelqwen3.5:2b, messages[{role: user, content: 天空为什么是蓝色的?}], streamFalse ) print(response.choices[0].message.content)2.2 Python 调用Ollama 原生 Clientfrom ollama import Client client Client(http://localhost:11434) response client.chat( modelqwen3.5:2b, messages[{role: user, content: 你叫什么名字?}] ) print(response.message.content)2.3 HTTP 接口测试curl http://localhost:11434/api/generate -d { model: modelscope.cn/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF, prompt: 为什么天空是蓝色?, stream: false }三、三大本地部署工具对比速览维度OllamavLLMllama.cpp核心定位开箱即用高性能推理服务极致轻量底层引擎上手难度⭐ 极简⭐⭐⭐ 需配置环境⭐⭐⭐⭐⭐ 硬核编译调参运行格式GGUFHuggingFace (Safetensors)GGUF硬件依赖CPU / GPU 自动调度NVIDIA GPU (强依赖 CUDA)CPU / Apple Silicon / 低配GPU并发能力弱 (单用户友好)极强(高并发服务)弱 (单线程)适用场景个人开发、快速验证、本地 RAG企业级 API 服务、多卡并行推理边缘计算、旧电脑、树莓派一句话选型建议普通用户/开发者→Ollama省心专注应用企业服务/N卡环境→vLLM吞吐量王者低配硬件/嵌入式→llama.cppCPU 也能跑四、彩蛋模型输出自动发邮件import smtplib from email.mime.text import MIMEText from ollama import chat res chat(modelmodelscope.cn/unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF:latest, messages[{role: user, content: 给你的朋友写一封信}]) # SMTP 配置示例为163邮箱 msg MIMEText(res.message.content, plain, utf-8) msg[From] your_email163.com msg[To] receiverqq.com smtp smtplib.SMTP() smtp.connect(smtp.163.com, 25) smtp.login(your_email163.com, 授权码) smtp.sendmail(msg[From], msg[To], msg.as_string()) print(邮件发送成功)本地部署大模型已非常成熟Ollama ModelScope 的组合能让开发者在几分钟内跑起主流模型。根据自身场景开发/生产/边缘选择合适工具即可高效开启 AI 应用之旅。

BGE-Large-Zh开源可部署：完全离线、无API调用、数据不出本地

BGE-Large-Zh开源可部署：完全离线、无API调用、数据不出本地 1. 项目简介 BGE-Large-Zh是一个基于FlagEmbedding库和BAAI/bge-large-zh-v1.5模型开发的本地语义向量化工具，专门为中文语境优化设计。这个工具的核心价值在于完全本地运行，不需…...

2026/4/21 1:03:17 阅读更多 →

你的 Skill 真的好用吗？来自OpenAI的 Eval 系统化验证 Agent 技能方法论

你最后一次验证 Skill 是怎么做的？写完一个 Skill，手动触发了几次，输出看起来还不错——然后就上线了。这大概是大多数人验证 Skill 的完整流程。说出来有点惭愧，但确实如此。我们在写普通代码时会写单元测试、跑 CI，但到了 Skill 这里，突然回到了"凭感觉"…...

2026/4/21 0:58:53 阅读更多 →

SMUDebugTool：三步解锁AMD Ryzen隐藏性能的终极免费工具

SMUDebugTool：三步解锁AMD Ryzen隐藏性能的终极免费工具【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://…...

2026/4/21 0:57:09 阅读更多 →