在Windows上部署Ollama

本文只针对N卡其它显卡请自行查找方法网络问题也请自行解决

本文使用环境
系统: Windows 10 IoT 企业版 LTSC 21H2
CPU: AMD Ryzen 7 5800H
内存: DDR4 3200Mhz 16G x2
GPU: NVIDIA GeForce RTX 3060 Laptop

Ollama 是一个开源的轻量级框架，旨在帮助用户在本地计算机上快速部署和运行大型语言模型（LLMs），无需依赖云端服务。它专注于简化模型的下载、配置和交互流程，尤其适合开发者、研究人员或对隐私和数据控制有要求的用户。(由deepseek-r1生成)

点击Download下载安装ollama 一直点install即可安装完成后按Win+R输入cmd 回车打开命令行输入ollama -v验证安装

ollama -v

ollama提供了一个模型库找到你需要的模型这里选择deepseek-r1 根据你的需求选择不同参数量的模型理论上选择比自己显存小的即可但是6G显存也是可以跑7b的只是非常极限在爆显存的边缘

这里选择7b 点击右侧图标复制命令回到cmd 粘贴命令然后等待下载下载完成后即可使用按Ctrl+D或者输入/bye关闭

使用ollama run deepseek-r1:7b --verbose可以显示性能信息

ollama run deepseek-r1:7b --verbose

在命令行中使用终归还是有些不方便的所以我们把ollama接入其它工具中这里使用Chatbox

Chatbox AI 是一款 AI 客户端应用和智能助手，支持众多先进的 AI 模型和 API，可在 Windows、MacOS、Android、iOS、Linux 和网页版上使用。

点击下载一直点击下一步即可点击完成 ![](attachments/Pasted image 20250204151930.png) 选择使用自己的API Key或本地模型选择Ollama API 选择模型点击保存即可开始使用

在Windows上部署Ollama ​