Ollama 操作和模型概览
ollama
常用命令
拉取模型
ollama run <模型名称型号>查看模型列表
ollama list | head -1 && ollama list | tail -n +2 | sort -k1按照模型名称和型号排序
只看模型名和型号
ollama list | awk '{print $1}'逐一更新模型
ollama list | tail -n +2 | awk '{print $1}' | xargs -I {} ollama pull {}AI 模型(ollama)
通用与推理类
| 模型及型号 | 制造商 | 擅长工作 | 不擅长的工作 | 推荐理由 |
|---|---|---|---|---|
| Llama 3.3/3.2 (1B/3B/8B) | Meta | 指令遵循、多轮对话、通用任务 | 中文语境深度理解(相对 Qwen 稍弱) | 行业标杆,生态兼容性最好,适合作为各种 AI 工具的基准测试。 |
| Qwen 2.5/3.5 (1.5B/3B/7B) | 阿里巴巴 | 中文理解、复杂逻辑推理、数学 | 极少数特定西语长文本 | 中文最强。对 Spring 等框架的中文文档理解极佳,7B 版本性能直逼旧版大模型。 |
| Gemma 2/3 (2B/9B) | 创意写作、总结、学术风格 | 严谨的代码格式输出(偶有幻觉) | 权重质量极高,指令遵循能力极强,2B 版本是同尺寸中的佼佼者。 | |
| Phi-4/Phi-3.5 (3.8B) | Microsoft | 逻辑推理、常识问答、科学计算 | 长文本创作、文学性任务 | 小参数之王。通过高质量合成数据训练,推理能力超越许多 7B 模型。 |
| DeepSeek-V3/R1 (1.5B/7B/8B) | DeepSeek | 深度思考、复杂逻辑、学术论文 | 简单的闲聊(R1 版本会过度思考) | 推理性能巅峰。R1 蒸馏版在逻辑链(CoT)表现上无出其右。 |
代码开发
| 模型及型号 | 制造商 | 擅长工作 | 不擅长的工作 | 推荐理由 |
|---|---|---|---|---|
| Qwen2.5-Coder (1.5B/7B) | 阿里巴巴 | Java/Spring 全栈开发、代码解释 | 纯文学创作 | 目前最强开源代码模型。对 MyBatis-Plus、Redis 等国内常用中间件支持极好。 |
| DeepSeek-Coder-V2 (16B/lite) | DeepSeek | 复杂 Bug 修复、架构设计、多语言 | 极小显存运行(lite 版也需一定资源) | 在代码补全和生成上处于第一梯队,处理复杂的 Java 泛型和反射逻辑很稳。 |
| Granite-Code (3B/8B) | IBM | 企业级代码规范、代码翻译、测试用例 | 前端 UI 审美设计 | 经过 IBM 严选数据训练,非常适合生成标准化的 Java 工业级代码。 |
| CodeGemma (2B/7B) | 代码补全、FIM(填空)任务 | 复杂系统架构方案 | 专为集成到 IDE 插件设计,延迟低,补全速度极快。 |
AG 与轻量化专项
| 模型及型号 | 制造商 | 擅长工作 | 不擅长的工作 | 推荐理由 |
|---|---|---|---|---|
| Nomic-Embed-Text | Nomic AI | 文本向量化(Embedding) | 直接对话、生成文本 | RAG 必备。支持长文本窗口,是目前 Ollama 上最推荐的向量模型。 |
| Command-R (35B) | Cohere | RAG 任务、长文档检索、工具调用 | 本地轻量化运行(需要较多显存) | 专门为 RAG 优化,擅长引用原文,是做企业知识库改造的首选方案。 |
| SmollM2 (135M/360M/1.7B) | HuggingFace | 边缘设备部署、简单文本分类 | 复杂逻辑推理 | 极其轻量,适合测试在资源受限环境(如 Android 端)下运行 AI。 |
| Minicpm-v (8B) | 面壁智能 | 多模态任务(识别图片中的架构图) | 纯长文本生成 | 优秀的视觉模型,可以将你的架构草图直接转化为 Markdown 或代码。 |
版权所有
版权归属:FelixJY
