Gemma 4 Ollama 安装教程:先拉对 tag,再验证 CLI 和 API
如果你只是想最快把 Gemma 4 在本地跑起来,先用 Ollama。最短路径就是:安装 Ollama,运行 ollama pull gemma4 或明确 tag,比如 gemma4:e4b、gemma4:26b、gemma4:31b,然后用 ollama list、ollama ps 和本地 API 做三步确认。
适合哪类搜索意图:如果你搜的是 “ollama pull gemma4”、“Gemma 4 Ollama 安装”、“gemma4:e4b 怎么跑” 这类问题,这篇就是最短可执行答案;如果你还没决定机器能跑哪个模型,先看 显存需求页。
Gemma 4 Ollama 最常用命令
如果你只想复制最关键的命令,这一段就够用了:
ollama pull gemma4
ollama pull gemma4:e4b
ollama pull gemma4:26b
ollama pull gemma4:31b
ollama list
ollama ps
ollama run gemma4:e4b
默认建议:大多数用户第一次不要直接拉最大的 tag。先从 gemma4:e4b 开始,把安装、对话、API 三件事跑通,再考虑是否值得升级到 26b 或 31b。
快速步骤
- 安装 Ollama。
- 运行
ollama pull gemma4或一个明确的 tag。 - 用
ollama list确认模型已经在本地。 - 用
ollama run做一次真实对话。 - 用
ollama ps和本地 API 做最后验证。
安装 Ollama
最稳妥的路径仍然是官方安装方式。Mac 用 Homebrew 或官方桌面版,Windows 用安装程序,Linux 常见的是官方 shell 脚本。
curl -fsSL https://ollama.com/install.sh | sh
brew install --cask ollama
Windows 安装后如果命令不生效,先完全关闭并重新打开 PowerShell 或终端,让 PATH 更新。
先拉哪个 Gemma 4 tag?
这才是大多数用户真正想问的问题。下面这张表可以直接决定你该执行哪条 ollama pull 命令。
| 你的机器或目标 | 推荐命令 | 为什么 |
|---|---|---|
| 只想验证工作流,或机器比较弱 | ollama pull gemma4:e2b |
下载更快、占用更低,适合验证安装链路是否通了。 |
| 8-12 GB 显卡,或 Mac 16 GB 统一内存起步 | ollama pull gemma4:e4b |
最平衡的一档,质量、速度、稳定性都更适合第一次上手。 |
| 16 GB 级显卡,想追求更高质量 | ollama pull gemma4:26b |
这时更大的 tag 才开始有现实意义,而不是“勉强能跑”。 |
| 24 GB 级显卡或高内存工作站 | ollama pull gemma4:31b |
最大本地档位,适合已经确认机器余量很充足的情况。 |
gemma4 是默认 tag,适合想省事的用户;如果你想要可复现结果、明确控制下载体积、或按硬件精确选型,就直接用 gemma4:e4b、gemma4:26b 这类显式 tag。
下载后先做哪三个检查?
ollama list
ollama ps
ollama run gemma4:e4b "请用三句话介绍本地 AI 的价值"
ollama list:确认模型已经下载完成。ollama ps:确认模型在运行,而不是刚装好但没有真正推理。ollama run:确认它能给出真实回复,而不只是“命令没报错”。
本地 API 怎么验证?
CLI 通了之后,最好立刻测 API。这样你能马上知道后续脚本、应用、自动化链路是不是也已经可用。
curl http://localhost:11434/api/generate \
-d '{"model":"gemma4:e4b","prompt":"用一句话解释为什么很多人想本地跑大模型","stream":false}'
如果你拉的是 gemma4:26b,API 里也用同一个 tag 测,避免出现 “CLI 验证的是一个模型,API 请求的是另一个模型” 的误判。
Mac、Windows、Linux 的差别
- Mac:最省心,Apple Silicon 对本地模型友好,但还是要注意统一内存压力。
- Windows:最常见的问题是 PATH 和防火墙,不是模型本身。
- Linux:安装通常最快,但也更容易遇到驱动和权限细节。
常见问题
为什么 ollama pull gemma4 很慢?
模型文件本身不小,网络不稳定时会很明显。中断后重新执行同一条命令,通常会继续下载,而不是重新从头开始。
为什么明明装上了,但推理特别慢?
大多数时候不是 Ollama 坏了,而是 tag 选大了,或者机器已经开始吃交换分区。先退回 gemma4:e4b,比硬扛 26b/31b 更容易判断问题。
为什么 CLI 正常,API 却失败?
先看 ollama ps 里模型是否仍在运行,再确认 11434 端口是否通。Windows 上尤其要排查本机防火墙。
Test-NetConnection 127.0.0.1 -Port 11434
应该用 gemma4 还是明确 tag?
想省事就用 gemma4,想要稳定复现就用明确 tag。对做内容测试、脚本联调、或团队共享命令的人来说,显式 tag 更省沟通成本。
第一次安装 Gemma 4,最推荐拉哪个 Ollama tag?
对大多数用户来说,gemma4:e4b 是最稳妥的第一拉。它兼顾成功率、速度、模型质量,也更容易暴露“环境问题”和“硬件不够”之间的区别。
ollama pull gemma4:26b 适合什么机器?
更适合 16 GB 级显卡或更强的 Apple Silicon 内存配置。如果你在 8-12 GB 机器上直接拉 26b,常见结果是“能启动,但不适合日常用”。
ollama list 和 ollama ps 有什么区别?
ollama list 看的是本地已下载模型,ollama ps 看的是当前运行中的模型。安装排错时,两者一起看最有效。
内容对你有帮助?欢迎请我喝杯咖啡 ☕ 支持独立站持续更新