部署 更新于 2026-04-17 7 分钟

Gemma 4 Ollama 安装教程:先拉对 tag,再验证 CLI 和 API

如果你只是想最快把 Gemma 4 在本地跑起来,先用 Ollama。最短路径就是:安装 Ollama,运行 ollama pull gemma4 或明确 tag,比如 gemma4:e4bgemma4:26bgemma4:31b,然后用 ollama listollama ps 和本地 API 做三步确认。

适合哪类搜索意图:如果你搜的是 “ollama pull gemma4”、“Gemma 4 Ollama 安装”、“gemma4:e4b 怎么跑” 这类问题,这篇就是最短可执行答案;如果你还没决定机器能跑哪个模型,先看 显存需求页

Gemma 4 Ollama 最常用命令

如果你只想复制最关键的命令,这一段就够用了:

ollama pull gemma4
ollama pull gemma4:e4b
ollama pull gemma4:26b
ollama pull gemma4:31b
ollama list
ollama ps
ollama run gemma4:e4b

默认建议:大多数用户第一次不要直接拉最大的 tag。先从 gemma4:e4b 开始,把安装、对话、API 三件事跑通,再考虑是否值得升级到 26b 或 31b。

快速步骤

  1. 安装 Ollama。
  2. 运行 ollama pull gemma4 或一个明确的 tag。
  3. ollama list 确认模型已经在本地。
  4. ollama run 做一次真实对话。
  5. ollama ps 和本地 API 做最后验证。

安装 Ollama

最稳妥的路径仍然是官方安装方式。Mac 用 Homebrew 或官方桌面版,Windows 用安装程序,Linux 常见的是官方 shell 脚本。

curl -fsSL https://ollama.com/install.sh | sh
brew install --cask ollama

Windows 安装后如果命令不生效,先完全关闭并重新打开 PowerShell 或终端,让 PATH 更新。

先拉哪个 Gemma 4 tag?

这才是大多数用户真正想问的问题。下面这张表可以直接决定你该执行哪条 ollama pull 命令。

你的机器或目标 推荐命令 为什么
只想验证工作流,或机器比较弱 ollama pull gemma4:e2b 下载更快、占用更低,适合验证安装链路是否通了。
8-12 GB 显卡,或 Mac 16 GB 统一内存起步 ollama pull gemma4:e4b 最平衡的一档,质量、速度、稳定性都更适合第一次上手。
16 GB 级显卡,想追求更高质量 ollama pull gemma4:26b 这时更大的 tag 才开始有现实意义,而不是“勉强能跑”。
24 GB 级显卡或高内存工作站 ollama pull gemma4:31b 最大本地档位,适合已经确认机器余量很充足的情况。

gemma4 是默认 tag,适合想省事的用户;如果你想要可复现结果、明确控制下载体积、或按硬件精确选型,就直接用 gemma4:e4bgemma4:26b 这类显式 tag。

下载后先做哪三个检查?

ollama list
ollama ps
ollama run gemma4:e4b "请用三句话介绍本地 AI 的价值"
  • ollama list确认模型已经下载完成。
  • ollama ps确认模型在运行,而不是刚装好但没有真正推理。
  • ollama run确认它能给出真实回复,而不只是“命令没报错”。

本地 API 怎么验证?

CLI 通了之后,最好立刻测 API。这样你能马上知道后续脚本、应用、自动化链路是不是也已经可用。

curl http://localhost:11434/api/generate \
  -d '{"model":"gemma4:e4b","prompt":"用一句话解释为什么很多人想本地跑大模型","stream":false}'

如果你拉的是 gemma4:26b,API 里也用同一个 tag 测,避免出现 “CLI 验证的是一个模型,API 请求的是另一个模型” 的误判。

Mac、Windows、Linux 的差别

  • Mac:最省心,Apple Silicon 对本地模型友好,但还是要注意统一内存压力。
  • Windows:最常见的问题是 PATH 和防火墙,不是模型本身。
  • Linux:安装通常最快,但也更容易遇到驱动和权限细节。

常见问题

为什么 ollama pull gemma4 很慢?

模型文件本身不小,网络不稳定时会很明显。中断后重新执行同一条命令,通常会继续下载,而不是重新从头开始。

为什么明明装上了,但推理特别慢?

大多数时候不是 Ollama 坏了,而是 tag 选大了,或者机器已经开始吃交换分区。先退回 gemma4:e4b,比硬扛 26b/31b 更容易判断问题。

为什么 CLI 正常,API 却失败?

先看 ollama ps 里模型是否仍在运行,再确认 11434 端口是否通。Windows 上尤其要排查本机防火墙。

Test-NetConnection 127.0.0.1 -Port 11434

应该用 gemma4 还是明确 tag?

想省事就用 gemma4,想要稳定复现就用明确 tag。对做内容测试、脚本联调、或团队共享命令的人来说,显式 tag 更省沟通成本。

第一次安装 Gemma 4,最推荐拉哪个 Ollama tag?

对大多数用户来说,gemma4:e4b 是最稳妥的第一拉。它兼顾成功率、速度、模型质量,也更容易暴露“环境问题”和“硬件不够”之间的区别。

ollama pull gemma4:26b 适合什么机器?

更适合 16 GB 级显卡或更强的 Apple Silicon 内存配置。如果你在 8-12 GB 机器上直接拉 26b,常见结果是“能启动,但不适合日常用”。

ollama listollama ps 有什么区别?

ollama list 看的是本地已下载模型,ollama ps 看的是当前运行中的模型。安装排错时,两者一起看最有效。

内容对你有帮助?欢迎请我喝杯咖啡 ☕ 支持独立站持续更新

赞赏码

相关文章