使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

博主： Kevin Zhang
发布时间：2024 年 08 月 20 日
3596 次浏览
暂无评论
3093字数
分类： IT技术 Docker与容器化人工智能

Ollama是一款开源工具，允许用户在本地轻松运行多种大型开源模型，包括清华大学的ChatGLM、阿里的千问，以及Meta的llama等。该工具目前兼容macOS、Linux和Windows三大主流操作系统。本文将详细介绍如何通过Docker安装Ollama，并将其部署以使用本地大模型，此外还将介绍如何通过接入one-api，实现对所需大规模语言模型的API调用。

硬件配置要求

运行大模型对硬件配置要求较高，因此建议使用配置更高的设备，尤其是配备独立显卡的机器。推荐配置如下：

CPU：E5-2696 v2
内存：64GB
硬盘：512GB SSD
显卡：无（使用CPU跑模型）

注：博主的服务器没有显卡，因此只能使用CPU来跑模型。

Docker安装Ollama

Ollama支持通过Docker安装，这极大地简化了服务器端的部署过程。以下是使用docker compose工具运行Ollama的步骤：

创建docker-compose.yaml文件，内容如下：

version: '3'
services:
 ollama:
   image: ollama/ollama
   container_name: ollama
   ports:
     - "11434:11434"
   volumes:
     - ./data:/root/.ollama
   restart: always

在命令行中输入以下命令启动容器：
```
docker compose up -d
```
访问 http://IP:11434，当看到提示“Ollama is running”时，说明Ollama已成功运行。

如果您的机器支持GPU，可以参考官方文档添加GPU参数。

部署大模型

Ollama安装完成后，您需要下载所需的大模型。Ollama支持的模型列表可以在官网找到。默认情况下，Ollama没有提供WEB界面，因此需要通过命令行操作。

进入Ollama容器：

docker exec -it ollama /bin/bash

在容器中，使用以下命令下载并运行阿里千问2模型：

ollama run qwen2

模型下载完成后，您可以通过命令行进行交互：

Ollama常用命令

运行指定大模型：ollama run llama3:8b-text
查看本地大模型列表：ollama list
查看运行中的大模型：ollama ps
删除指定大模型：ollama rm llama3:8b-text

提示：更多命令可以通过ollama -h查看。

大模型使用体验

博主使用了llama2/qwen2/glm4/llama3/phi3等模型，得到以下体验总结：

llama模型对中文支持不佳。
phi3:3.8b模型较为简单，可能是模型参数过少，提升至14b可能会有所改善。
glm4/qwen2对中文支持较好。
模型参数越小，模型表现越弱。7b及以上模型表现较为稳定。
纯CPU运行7b模型速度稍慢。

将Ollama接入one-api

one-api是一个开源的AI中间件服务，可以整合多家大模型API，提供统一的调用方法。以下是接入步骤：

在one-api后台添加一个新的渠道，选择类型为Ollama。
设置渠道API地址为Ollama的WEB地址（如http://IP:11434）。
填写已下载的大模型名称和一个随机密钥。

成功接入后，可以通过以下命令调用模型：

curl https://ai.xxx.com/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{
    "model": "qwen2",
    "messages": [
      {
        "role": "system",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Hello!"
      }
    ]
  }'

注：将ai.xxx.com替换为one-api的域名，将sk-xxx替换为one-api令牌。

遇到的问题

博主在使用stream方式调用one-api Ollama时，遇到返回空白的问题。根据issues页面的反馈，这是由于one-api的BUG导致的，降级至0.6.6版本可解决此问题。

安全性建议

由于Ollama没有内置鉴权机制，将其部署在服务器上存在安全隐患。为提高安全性，建议采取以下措施：

Linux内置防火墙：使用HOST网络并限制指定IP访问11434端口。
Nginx反向代理：将Ollama映射到127.0.0.1，通过Nginx设置IP白名单和黑名单。

结语

Ollama作为一款开源工具，为用户提供了便捷的本地大模型部署和调用方案。其出色的兼容性和灵活性，使得用户能够在多个操作系统上轻松运行大型语言模型。通过Docker的安装和部署，Ollama大大简化了用户的使用过程。然而，因缺乏内置鉴权机制，用户在生产环境中应注意采取适当的安全措施。总体而言，Ollama在本地AI模型应用和开发中具备极大的实用价值。

END

本文作者： Kevin Zhang
文章标题：使用 Docker 安装 Ollama 部署本地大模型并接入 One-API
本文地址： https://www.haovps.top/archives/290.html
版权说明：若无注明，本文皆高性能VPS推荐与IT技术博客 | Haovps.Top 原创，转载请保留文章出处。

最后修改：2024 年 12 月 16 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

打卡

语录

私密评论

名称 *

🎲

邮箱 *

地址

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

Kevin Zhang • 2024 年 08 月 20 日

<p><a href="https://www.haovps.top/tag/Ollama/"target="_self" title="Ollama">Ollama</a>是一款<a href="https://www.haovps.top/tag/%E5%BC%80%E6%BA%90%E5%B7%A5%E5%85%B7/"target="_self" title="开源工具">开源工具</a>，允许用户在本地轻松运行多种大型<a href="https://www.haovps.top/tag/%E5%BC%80%E6%BA%90/"target="_self" title="开源">开源</a>模型，包括清华大学的ChatGLM、阿里的千问，以及<a href="https://www.haovps.top/tag/Meta/"target="_self" title="Meta">Meta</a>的llama等。该工具目前兼容macOS、<a href="https://www.haovps.top/tag/Linux/"target="_self" title="Linux">Linux</a>和<a href="https://www.haovps.top/tag/Windows/"target="_self" title="Windows">Windows</a>三大主流操作系统。本文将详细介绍如何通过<a href="https://www.haovps.top/tag/Docker%E5%AE%89%E8%A3%85/"target="_self" title="Docker安装">Docker安装</a>Ollama，并将其部署以使用<a href="https://www.haovps.top/tag/%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B/"target="_self" title="本地大模型">本地大模型</a>，此外还将介绍如何通过接入<a href="https://www.haovps.top/tag/one-api/"target="_self" title="one-api">one-api</a>，实现对所需大规模语言模型的<a href="https://www.haovps.top/tag/API%E8%B0%83%E7%94%A8/"target="_self" title="API调用">API调用</a>。</p><p><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="Ollama工具展示" title="Ollama工具展示" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/9f11680ddfe33ce3b9e92ffd5a223079.jpg"></p><h3>硬件配置要求</h3><p>运行<a href="https://www.haovps.top/tag/%E5%A4%A7%E6%A8%A1%E5%9E%8B/"target="_self" title="大模型">大模型</a>对硬件配置要求较高，因此建议使用配置更高的设备，尤其是配备独立显卡的机器。推荐配置如下：</p><ul><li><strong>CPU</strong>：E5-2696 v2</li><li><strong>内存</strong>：64GB</li><li><strong>硬盘</strong>：5<a href="https://www.haovps.top/tag/tag-bd5b31ec40f7c56a8c2c545b7d51f4cf/"target="_self" title="1">1</a>2GB SSD</li><li><strong>显卡</strong>：无（使用CPU跑模型）</li></ul><blockquote>注：博主的<a href="https://www.haovps.top/tag/tag-3985df2e6400657cc8388614aefd5def/"target="_self" title="服务器">服务器</a>没有显卡，因此只能使用CPU来跑模型。</blockquote><h3><a href="https://www.haovps.top/tag/Docker/"target="_self" title="Docker">Docker</a>安装Ollama</h3><p>Ollama支持通过Docker安装，这极大地简化了服务器端的部署过程。以下是使用docker compose工具运行Ollama的步骤：</p><ol><li><p>创建<code>docker-compose.yaml</code>文件，内容如下：</p><pre><code class="lang-yaml">version: '3'
services:
 ollama:
   image: ollama/ollama
   container_name: ollama
   ports:
     - &quot;11434:11434&quot;
   volumes:
     - ./data:/root/.ollama
   restart: always</code></pre></li><li><p>在<a href="https://www.haovps.top/tag/%E5%91%BD%E4%BB%A4/"target="_self" title="命令">命令</a>行中输入以下命令启动容器：</p><pre><code class="lang-bash">docker compose up -d</code></pre></li><li>访问 <code>http://IP:11434</code>，当看到提示“Ollama is running”时，说明Ollama已成功运行。</li></ol><p><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="Ollama运行成功界面" title="Ollama运行成功界面" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/1330c47cdbffcf460e217de42af009b1.png"></p><blockquote>如果您的机器支持GPU，可以参考<a href="https://www.haovps.top/go/aHR0cHM6Ly9odWIuZG9ja2VyLmNvbS9yL29sbGFtYS9vbGxhbWE" target="_blank" >官方文档</a>添加GPU参数。</blockquote><h3>部署大模型</h3><p><a href="https://www.haovps.top/tag/Ollama%E5%AE%89%E8%A3%85/"target="_self" title="Ollama安装">Ollama安装</a>完成后，您需要下载所需的大模型。Ollama支持的模型列表可以在<a href="https://www.haovps.top/go/aHR0cHM6Ly9vbGxhbWEuY29tL2xpYnJhcnk" target="_blank" >官网</a>找到。默认情况下，Ollama没有提供WEB界面，因此需要通过命令行操作。</p><p>进入Ollama容器：</p><pre><code class="lang-bash">docker exec -it ollama /bin/bash</code></pre><p>在容器中，使用以下命令下载并运行阿里千问2模型：</p><pre><code class="lang-bash">ollama run qwen2</code></pre><p><a href="https://www.haovps.top/tag/%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD/"target="_self" title="模型下载">模型下载</a>完成后，您可以通过命令行进行交互：</p><p><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="模型运行示例" title="模型运行示例" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/3e0ac56dd44938c44a4afafa96b8f8d8.png"></p><p><strong>Ollama常用命令</strong></p><ul><li>运行指定大模型：<code>ollama run llama3:8b-text</code></li><li>查看本地大模型列表：<code>ollama list</code></li><li>查看运行中的大模型：<code>ollama ps</code></li><li>删除指定大模型：<code>ollama rm llama3:8b-text</code></li></ul><blockquote>提示：更多命令可以通过<code>ollama -h</code>查看。</blockquote><h3>大模型使用体验</h3><p>博主使用了<code>llama2/qwen2/glm4/llama3/phi3</code>等模型，得到以下体验总结：</p><ul><li><code>llama</code>模型对<a href="https://www.haovps.top/tag/%E4%B8%AD%E6%96%87/"target="_self" title="中文">中文</a>支持不佳。</li><li><code>phi3:3.8b</code>模型较为简单，可能是模型参数过少，提升至<code>14b</code>可能会有所改善。</li><li><code>glm4/qwen2</code>对中文支持较好。</li><li>模型参数越小，模型表现越弱。<code>7b</code>及以上模型表现较为稳定。</li><li>纯CPU运行<code>7b</code>模型速度稍慢。</li></ul><h3>将Ollama接入one-api</h3><p>one-api是一个开源的<a href="https://www.haovps.top/tag/AI/"target="_self" title="AI">AI</a>中间件服务，可以整合多家大模型API，提供统一的调用方法。以下是接入步骤：</p><ol><li>在one-api后台添加一个新的渠道，选择类型为Ollama。</li><li>设置渠道API地址为Ollama的WEB地址（如<code>http://IP:11434</code>）。</li><li>填写已下载的大模型名称和一个随机密钥。</li></ol><p>成功接入后，可以通过以下命令调用模型：</p><pre><code class="lang-bash">curl https://ai.xxx.com/v1/chat/completions \
  -H &quot;Content-Type: application/json&quot; \
  -H &quot;Authorization: Bearer sk-xxx&quot; \
  -d '{
    &quot;model&quot;: &quot;qwen2&quot;,
    &quot;messages&quot;: [
      {
        &quot;role&quot;: &quot;system&quot;,
        &quot;content&quot;: &quot;You are a helpful assistant.&quot;
      },
      {
        &quot;role&quot;: &quot;user&quot;,
        &quot;content&quot;: &quot;Hello!&quot;
      }
    ]
  }'</code></pre><blockquote>注：将<code>ai.xxx.com</code>替换为one-api的域名，将<code>sk-xxx</code>替换为one-api令牌。</blockquote><p><strong>遇到的问题</strong></p><p>博主在使用stream方式调用one-api Ollama时，遇到返回空白的问题。根据<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL3NvbmdxdWFucGVuZy9vbmUtYXBpL2lzc3Vlcy8xNjE1" target="_blank" >issues</a>页面的反馈，这是由于one-api的BUG导致的，降级至<code>0.6.6</code>版本可解决此问题。</p><h3>安全性建议</h3><p>由于Ollama没有内置鉴权机制，将其部署在服务器上存在安全隐患。为提高安全性，建议采取以下措施：</p><ul><li><strong>Linux内置防火墙</strong>：使用HOST网络并限制指定IP访问11434端口。</li><li><strong>Nginx反向代理</strong>：将Ollama映射到<code>127.0.0.1</code>，通过<a href="https://www.haovps.top/tag/Nginx/"target="_self" title="Nginx">Nginx</a>设置IP白名单和黑名单。</li></ul><h3>结语</h3><p>Ollama作为一款开源工具，为用户提供了便捷的本地<a href="https://www.haovps.top/tag/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E9%83%A8%E7%BD%B2/"target="_self" title="大模型部署">大模型部署</a>和调用方案。其出色的兼容性和灵活性，使得用户能够在多个操作系统上轻松运行<a href="https://www.haovps.top/tag/%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/"target="_self" title="大型语言模型">大型语言模型</a>。通过Docker的安装和部署，Ollama大大简化了用户的使用过程。然而，因缺乏内置鉴权机制，用户在生产环境中应注意采取适当的安全措施。总体而言，Ollama在本地<a href="https://www.haovps.top/tag/AI%E6%A8%A1%E5%9E%8B/"target="_self" title="AI模型">AI模型</a>应用和开发中具备极大的实用价值。</p>

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

硬件配置要求

Docker安装Ollama

部署大模型

大模型使用体验

将Ollama接入one-api

安全性建议

结语

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

OpenWrt 固件上安装 SSRplus、Passwall 和 Hello World 插件的详细教程

OpenWrt 安装与配置 AdGuard Home 实现全局广告拦截的详细教程

2025年最新OpenClash安装与配置指南

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

使用Docker搭建网页版VSCode：实现跨平台远程开发

PaoPao：基于Go构建的开源微社区，轻松打造创意互动平台

使用Docker部署Mango：开源的漫画管理与阅读工具

使用Virtual DSM在Docker中运行Synology DSM：本地虚拟化解决方案

Heynote：开发者专属的智能记事本

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

硬件配置要求

Docker安装Ollama

部署大模型

大模型使用体验

将Ollama接入one-api

安全性建议

结语

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款