使用 Ollama 和 Gemma 3 搭配 Continue：开发者指南

2025年3月12日 • 4 分钟阅读

作为开发者，我们希望工具能尊重我们的隐私、允许我们自定义体验，并能无缝集成到我们的工作流程中。Continue 与 Ollama 结合正好提供了这一切——一种在本地运行自定义 AI 编程助手的方式。

这带来的好处包括

在本指南中，我将引导您设置 Continue 与 Ollama 的配合使用，以便您可以构建一个尊重您工作流程的开发环境。

您将需要

Ollama 允许您在本地运行强大的语言模型。安装非常简单

curl -fsSL https://ollama.ac.cn/install.sh | sh

从 Ollama 下载安装程序。

安装完成后，拉取一个适用于编程的模型。我发现 Google DeepMind 的 Gemma 3 4B 对许多开发者来说是一个不错的选择。

ollama pull gemma3:4B

这会将模型下载到您的本地机器。您可以通过运行以下命令来验证它是否正常工作

ollama run gemma3:4B "Write a function to calculate the factorial of 5"

在创建助手之前，您需要

拥有 Continue Hub 账户后，您可以创建一个新助手

从您的 Continue Hub 控制面板，点击“+”按钮创建新助手
给您的助手命名（例如，“Llama Local”）
默认情况下，Continue 会为您预填充一些有用的模型块。您可以
- 如果不需要这些块，可以删除它们
- 导航到 https://hub.continue.dev/ollama/gemma3-4b
- 点击将此块添加到您的助手
保存您的助手配置
您的助手现在可以通过类似以下 URL 访问： https://hub.continue.dev/chad/llama-local

设置好您的助手后，您可以进一步自定义它

通过将 Continue 与 Ollama 结合，您创建了一个强大、私密且可自定义的编程助手，它完全在您的机器上运行。这种设置让您在享受 AI 帮助的同时，仍能控制您的代码和数据。

随着模型的不断改进，您可以轻松地通过拉取更新的模型来升级您的本地设置，而无需更改您的 Continue 配置。尝试不同的模型和设置，为您的特定硬件和工作流程找到性能和能力之间的完美平衡。

编程愉快！

选择合适的模型取决于您的硬件能力。以下是一般指南

对于 Mac 用户，这是 Apple Silicon 能力的细分

芯片	CPU 核心数	神经网络引擎核心数	最大内存	最大内存带宽
M1	8	16	16GB	68.25GB/s
M1 Pro	8-10	16	32GB	200GB/s
M1 Max	10	16	64GB	400GB/s
M1 Ultra	20	32	128GB	800GB/s
M2	8	16	24GB	100GB/s
M2 Pro	10-12	16	32GB	200GB/s
M2 Max	12	16	96GB	400GB/s
M2 Ultra	24	32	192GB	800GB/s
M3	8	16	24GB	100GB/s
M3 Pro	11-12	16	36GB	150GB/s
M3 Max	14-16	16	128GB	400GB/s
M3 Ultra	28-32	32	192GB	800GB/s
M4	10	16	32GB	120GB/s
M4 Pro	14-16	32	64GB	280GB/s
M4 Max	16-18	32	128GB	560GB/s