VS Code 中的 Vibe Coding

使用 DGX Spark 作为本地或远程 Vibe Coding 助手，配合 Ollama 和 Continue

概述

基本概念

本 playbook 引导你设置 DGX Spark 作为 Vibe Coding 助手——本地或作为 VSCode 与 Continue.dev 的远程编码伴侣。本指南使用 Ollama 和 GPT-OSS 120B 提供轻松部署到 VSCode 的编码助手。包含高级说明，允许 DGX Spark 和 Ollama 使编码助手可通过你的本地网络访问。本指南也是在操作系统全新安装上编写的。如果你的操作系统不是全新安装并且遇到问题，请参阅故障排除选项卡。

你将实现的目标

你将拥有一个完全配置的 DGX Spark 系统，能够： - 通过 Ollama 运行本地代码辅助。 - 为 Continue 和 VSCode 集成远程提供模型。 - 使用统一内存托管像 GPT-OSS 120B 这样的大型 LLM。

先决条件

DGX Spark（建议 128GB 统一内存）
Ollama 和你选择的 LLM（例如 gpt-oss:120b）
VSCode
Continue VSCode 扩展
用于模型下载的互联网访问
基本熟悉打开 Linux 终端、复制和粘贴命令。
具有 sudo 访问权限。
可选：用于远程访问配置的防火墙控制

时间与风险

持续时间： 大约 30 分钟
风险： 由于网络问题导致的数据下载缓慢或失败
回滚： 正常使用期间不进行永久系统更改。
最后更新： 2025年10月21日
首次发布

操作说明

步骤 1. 安装 Ollama

使用以下命令安装最新版本的 Ollama：

curl -fsSL https://ollama.com/install.sh | sh

服务运行后，拉取所需的模型：

ollama pull gpt-oss:120b

步骤 2. （可选）启用远程访问

要允许远程连接（例如，从使用 VSCode 和 Continue 的工作站），请修改 Ollama systemd 服务：

sudo systemctl edit ollama

在注释部分下方添加以下行：

[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
Environment="OLLAMA_ORIGINS=*"

重新加载并重启服务：

sudo systemctl daemon-reload
sudo systemctl restart ollama

如果使用防火墙，请打开端口 11434：

sudo ufw allow 11434/tcp

验证工作站可以连接到你的 DGX Spark 的 Ollama 服务器：

curl -v http://YOUR_SPARK_IP:11434/api/version

将 YOUR_SPARK_IP 替换为你的 DGX Spark 的 IP 地址。如果连接失败，请参阅故障排除选项卡。

步骤 3. 安装 VSCode

对于 DGX Spark（基于 ARM），下载并安装 VSCode：转到 https://code.visualstudio.com/download 并下载 VSCode 的 Linux ARM64 版本。下载完成后，请注意下载的包名称。在下一个命令中用它替换 DOWNLOADED_PACKAGE_NAME。

sudo dpkg -i DOWNLOADED_PACKAGE_NAME

如果使用远程工作站，安装适合你的系统架构的 VSCode。

步骤 4. 安装 Continue.dev 扩展

打开 VSCode 并从 Marketplace 安装 Continue.dev： - 转到 VSCode 中的 Extensions view（扩展视图） - 搜索由 Continue.dev 发布的 Continue 并安装扩展。安装后，点击右侧栏中的 Continue 图标。

步骤 5. 本地推理设置

点击 Or, configure your own models（或，配置你自己的模型）
点击 Click here to view more providers（点击此处查看更多信息提供者）
选择 Ollama 作为 Provider（提供者）
对于 Model（模型），选择 Autodetect（自动检测）
通过发送测试提示来测试推理。

你下载的模型现在将默认用于推理（例如 gpt-oss:120b）。

步骤 6. 设置工作站以连接到 DGX Spark 的 Ollama 服务器

要在工作站上运行 VSCode 并连接到远程 DGX Spark 实例，必须在该工作站上完成以下操作： - 如步骤 4 中所述安装 Continue - 点击左侧窗格中的 Continue 图标 - 点击 Or, configure your own models（或，配置你自己的模型） - 点击 Click here to view more providers（点击此处查看更多信息提供者） - 选择 Ollama 作为 Provider（提供者） - 选择 Autodetect 作为 Model（模型）。

Continue 将无法检测到模型，因为它试图连接到本地托管的 Ollama 服务器。 - 找到 Continue 窗口右上角的 gear 图标并点击它。 - 在左侧窗格中，点击 Models（模型） - 在 Chat 下的第一个下拉菜单旁边点击齿轮图标。 - Continue 的 config.yaml 将打开。记录你的 DGX Spark 的 IP 地址。 - 将配置替换为以下内容。YOUR_SPARK_IP 应替换为你的 DGX Spark 的 IP。

name: Config
version: 1.0.0
schema: v1

assistants:
  - name: default
    model: OllamaSpark

models:
  - name: OllamaSpark
    provider: ollama
    model: gpt-oss:120b
    apiBase: http://YOUR_SPARK_IP:11434
    title: gpt-oss:120b
    roles:
      - chat
      - edit
      - autocomplete

将 YOUR_SPARK_IP 替换为你的 DGX Spark 的 IP 地址。为任何其他你希望远程托管的 Ollama 模型添加额外的模型条目。

故障排除

症状	原因	解决方案
Ollama 未启动	GPU 驱动程序可能未正确安装	在终端中运行 `nvidia-smi`。如果命令失败，请检查 DGX Dashboard 是否有 DGX Spark 的更新。
Continue 无法通过网络连接	端口 11434 可能未打开或无法访问	运行命令 `ss -tuln \\| grep 11434`。如果输出未反映 `tcp LISTEN 0 4096 :11434 :*`，请回到步骤 2 并运行 ufw 命令。
Continue 无法检测本地运行的 Ollama 模型	配置未正确设置或检测	检查 `/etc/systemd/system/ollama.service.d/override.conf` 文件中的 `OLLAMA_HOST` 和 `OLLAMA_ORIGINS`。如果 `OLLAMA_HOST` 和 `OLLAMA_ORIGINS` 设置正确，请将这些行添加到你的 `~/.bashrc` 文件中。
高内存使用	模型太大	使用 `nvidia-smi` 确认没有其他大型模型或容器在运行。使用较小的模型，如 `gpt-oss:20b` 进行轻量级使用。

[!NOTE] DGX Spark 使用统一内存架构（UMA），允许 GPU 和 CPU 内存之间的动态共享。随着许多应用程序仍在更新以利用 UMA，即使在 DGX Spark 的内存容量内，你也可能遇到内存问题。如果发生这种情况，请手动刷新缓冲区缓存：
sudo sh -c 'sync; echo 3 > /proc/sys/vm/drop_caches'