最近,DeepSeek 发布的推理大模型 DeepSeek - R1 是 AI 大模型领域的一匹黑马。其在国外大模型排名 Arena 上的表现令人惊艳,基准测试位列全类别大模型第三,在风格控制类模型中与 OpenAI 的 o1 并列第一。1 月 27 日,该应用更是登顶中美应用商店免费应用下载榜,在美区超越 ChatGPT,引发了“国产之光”和“媲美 ChatGPT”等热议。
有博主评论称“吊打 OpenAI ChatGPT 的存在,不用不是中国人!”不过,我对此持保留态度,主要是为了体验而来。那么,让我们一起来体验一下吧!
本地搭建
有人可能会问,为什么不直接在 DeepSeek 官网体验?原因是本地搭建可以更好地保障数据安全,特别是在企业开发时,离线模式显得尤为重要。此外,官方虽然提供了 500W 的免费 Token,但总会有到期续费的时候。
1. 离线版安装
首先,下载并安装 Ollama 的离线安装包。接着,使用以下命令来安装 DeepSeek:
ollama run deepseek-r1:7b
由于模型较大,下载时间可能较长,建议使用加速下载。成功下载后,您将看到如下界面:
这标志着您可以正常使用该模型了!
2. 搭建 Web UI 用于网页对话
命令行操作虽然功能强大,但不够便捷。因此,我们需要一个类似 ChatGPT 的网页对话功能。这里,我们选择使用 Open Web UI,具体步骤如下:
首先,确保您已安装 Docker。访问 Docker 官网 下载适合您电脑的版本并安装。
安装完成后,打开 Docker,注册并登录。然后在右下角点击 Terminal,输入以下命令以运行 Open Web UI:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
Docker 启动后,您将看到欢迎页面,点击开始使用,开始体验。
体验使用
接下来,我准备了几个问题进行体验,具体如下:
1. 8.8 和 8.88 哪个大?
2. 010111010101101101 中有几个 1?
3. 她为什么背着我爱别人?
4. 使用 Python 语言写个冒泡排序
5. 来个逻辑推理
6. 再来个翻译
写在最后
通过测试不同类型的案例,包括数数、计算、推理和编程等,DeepSeek - R1 几乎都能正确回答,表现相当不错。不过,性能上来看,我的 Mac Pro 运行 7b 模型时略显吃力。😈
希望这篇文章能帮助到您顺利搭建和体验 DeepSeek - R1 模型!