Ollama跑DeepSeek零基础

admin 2026-06-23 04:49:54 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本教程详细介绍了使用Ollama3.2和OpenWebUI在本地部署运行DeepSeekV3模型的完整流程。内容涵盖Ollama的优势特性、硬件需求分析、具体安装步骤、模型下载方法及可视化界面配置,并提供了常见问题解决方案。教程强调该方案无需编程基础和环境配置,可实现完全本地化的安全部署。 综合评分: 85 文章分类: 安全工具,解决方案,应用安全,技术标准,其他


cover_image

Ollama跑DeepSeek零基础

原创

ladon ladon

306Safe

2026年6月22日 08:55 北京

在小说阅读器读本章

去阅读

本教程从零开始,手把手带你用 Ollama 3.2 + Open WebUI 在本地跑起 DeepSeek V3,全程不过 20 分钟。不需要懂 Python,不需要配 CUDA,下载即用。

一、先搞清楚:为什么选 Ollama?

Ollama 是目前最简单的本地大模型运行工具,没有之一。2026年6月发布的 3.2 版本带来三大革命性更新:

  • 全系列 GPU 自动识别

    :NVIDIA、AMD、Intel 核显全部开箱即用,不再需要手动装 CUDA

  • 模型并行加载

    :可以同时跑多个模型,切换零等待

  • Open WebUI 一键集成

    :浏览器里直接用,界面比 ChatGPT 还好看

对普通用户来说,以前本地部署大模型劝退 90% 的痛点——环境配置、依赖调试、驱动兼容——Ollama 3.2 全解决了。

二、硬件门槛:你电脑够不够?

先看显存要求(不同量化版本的 DeepSeek V3):

| 量化版本 | 显存需求 | 推荐显卡 | | — | — | — | | Q4_K_M(推荐) | 约 20GB | RTX 3090/4090 | | Q2_K(入门) | 约 10GB | RTX 3080/4070 | | DeepSeek-R1:7b | 约 4.7GB | RTX 3060 以上 |

没独显也能跑! Ollama 3.2 支持 CPU 推理,8GB 以上内存的电脑跑 7B 模型没问题,只是速度慢一些。Mac 用户 M1/M2/M3 芯片原生支持,体验丝滑。

三、Step 1:安装 Ollama

Windows:

  1. 打开官网 ollama.com,点击 Download
  2. 下载 OllamaSetup.exe(约 80MB),双击安装
  3. 安装完成后,打开终端验证:
   ollama --version # 输出: ollama version is 3.2.x

macOS:

  1. 官网下载 Ollama-darwin.zip
  2. 解压后拖入 Applications,双击启动
  3. 终端验证同上

Linux:

curl -fsSL https://ollama.com/install.sh | sh

四、Step 2:下载并运行 DeepSeek

跑 DeepSeek-R1:7b(4.7GB,入门首选):

ollama run deepseek-r1:7b

首次运行会自动下载模型,7b 版本约 4.7GB,网速正常 2-3 分钟下完。下载完成后直接进入对话模式,输入问题即可。

跑 DeepSeek-V3(完整版,Q4量化):

ollama run deepseek-v3

V3 完整版约 20GB,下载需要 10-15 分钟,耐心等待。

查看已下载的模型:

ollama list # 输出类似: # NAME                ID              SIZE    MODIFIED # deepseek-r1:7b      xxxxx          4.7 GB  2 minutes ago

五、Step 3:装 Open WebUI(可视化界面)

终端里聊天不够直观?装个 Web 界面,体验媲美 ChatGPT。

方法A:Docker 一键部署(推荐)

docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui   --restart always   ghcr.io/open-webui/open-webui:main

打开浏览器访问 http://localhost:3000,首次需要注册一个管理员账号(纯本地,不上传任何数据)。

方法B:pip 安装(无 Docker 时)

pip install open-webui open-webui serve

访问 http://localhost:8080

六、Step 4:在 WebUI 中选择模型对话

Open WebUI 会自动检测 Ollama 中已下载的模型。在左上角模型选择器中:

  1. 点击模型下拉框
  2. 选择 deepseek-r1:7b 或 deepseek-v3
  3. 开始对话!

实用技巧:

  • 在设置中开启联网搜索,DeepSeek 会自动判断是否需要搜索
  • 开启深度思考模式,DeepSeek-R1 会展示完整推理链
  • 上传文档/PDF 可直接让模型基于文档内容回答

七、常见问题

Q:下载速度慢/连接超时?

A:设置代理:终端执行 set HTTPS_PROXY=http://127.0.0.1:7890(换成你自己的代理地址)

Q:显存不够报错 CUDA out of memory?

A:换小量化版本,或强制用 CPU:OLLAMA_NUM_GPU=0 ollama run deepseek-r1:7b

Q:模型回复速度慢?

A:7b 模型在 CPU 上约 5-10 token/s,GPU 上 30-50 token/s。V3 在 RTX 4090 上约 20-30 token/s。速度正常,耐心等。

总结:4步搞定——安装Ollama -> 下载DeepSeek -> 装Open WebUI -> 开始对话。你的数据全程留在本地,不上传任何云端,这就是本地部署最大的意义。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:306Safe ladon ladon《Ollama跑DeepSeek零基础》

评论:0   参与:  0