Ollama 操作和模型概览

约 846 字大约 3 分钟

2026-03-18

ollama

拉取模型

ollama run <模型名称型号>

查看模型列表

ollama list | head -1 && ollama list | tail -n +2 | sort -k1

按照模型名称和型号排序

只看模型名和型号

ollama list | awk '{print $1}'

逐一更新模型

ollama list | tail -n +2 | awk '{print $1}' | xargs -I {} ollama pull {}

模型及型号	制造商	擅长工作	不擅长的工作	推荐理由
Llama 3.3/3.2 (1B/3B/8B)	Meta	指令遵循、多轮对话、通用任务	中文语境深度理解（相对 Qwen 稍弱）	行业标杆，生态兼容性最好，适合作为各种 AI 工具的基准测试。
Qwen 2.5/3.5 (1.5B/3B/7B)	阿里巴巴	中文理解、复杂逻辑推理、数学	极少数特定西语长文本	中文最强。对 Spring 等框架的中文文档理解极佳，7B 版本性能直逼旧版大模型。
Gemma 2/3 (2B/9B)	Google	创意写作、总结、学术风格	严谨的代码格式输出（偶有幻觉）	权重质量极高，指令遵循能力极强，2B 版本是同尺寸中的佼佼者。
Phi-4/Phi-3.5 (3.8B)	Microsoft	逻辑推理、常识问答、科学计算	长文本创作、文学性任务	小参数之王。通过高质量合成数据训练，推理能力超越许多 7B 模型。
DeepSeek-V3/R1 (1.5B/7B/8B)	DeepSeek	深度思考、复杂逻辑、学术论文	简单的闲聊（R1 版本会过度思考）	推理性能巅峰。R1 蒸馏版在逻辑链（CoT）表现上无出其右。

模型及型号	制造商	擅长工作	不擅长的工作	推荐理由
Qwen2.5-Coder (1.5B/7B)	阿里巴巴	Java/Spring 全栈开发、代码解释	纯文学创作	目前最强开源代码模型。对 MyBatis-Plus、Redis 等国内常用中间件支持极好。
DeepSeek-Coder-V2 (16B/lite)	DeepSeek	复杂 Bug 修复、架构设计、多语言	极小显存运行（lite 版也需一定资源）	在代码补全和生成上处于第一梯队，处理复杂的 Java 泛型和反射逻辑很稳。
Granite-Code (3B/8B)	IBM	企业级代码规范、代码翻译、测试用例	前端 UI 审美设计	经过 IBM 严选数据训练，非常适合生成标准化的 Java 工业级代码。
CodeGemma (2B/7B)	Google	代码补全、FIM（填空）任务	复杂系统架构方案	专为集成到 IDE 插件设计，延迟低，补全速度极快。

模型及型号	制造商	擅长工作	不擅长的工作	推荐理由
Nomic-Embed-Text	Nomic AI	文本向量化（Embedding）	直接对话、生成文本	RAG 必备。支持长文本窗口，是目前 Ollama 上最推荐的向量模型。
Command-R (35B)	Cohere	RAG 任务、长文档检索、工具调用	本地轻量化运行（需要较多显存）	专门为 RAG 优化，擅长引用原文，是做企业知识库改造的首选方案。
SmollM2 (135M/360M/1.7B)	HuggingFace	边缘设备部署、简单文本分类	复杂逻辑推理	极其轻量，适合测试在资源受限环境（如 Android 端）下运行 AI。
Minicpm-v (8B)	面壁智能	多模态任务（识别图片中的架构图）	纯长文本生成	优秀的视觉模型，可以将你的架构草图直接转化为 Markdown 或代码。

版权归属：FelixJY