通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

博主： Kevin Zhang
发布时间：2024 年 08 月 11 日
3432 次浏览
暂无评论
4123字数
分类： IT技术人工智能

前言

在上一篇文章中，我们介绍了如何使用RAG技术构建本地知识库，基于 Ollama 和 Qwen2.5 实现了与本地私有知识库文件的自然语言交互。本文将继续探讨另一种实现方式，即通过 Ollama 与 RagFlow 的组合来实现，其中 Ollama 使用的模型仍然是Qwen2。

首先，让我们回顾一下 RAG 的常见应用架构：

RagFlow 的安装和部署

前置条件

为了成功安装和运行 RagFlow，您的系统应满足以下要求：

CPU：至少 4 核
内存：至少 16 GB
磁盘空间：至少 50 GB
Docker：版本 >= 24.0.0 & Docker Compose >= v2.26.1

安装步骤

克隆仓库：

git clone https://github.com/infiniflow/ragflow.git

启动服务器：进入 docker 文件夹，并使用预编译的 Docker 镜像启动服务器：
```
cd ragflow/docker
chmod +x ./entrypoint.sh
docker compose -f docker-compose-CN.yml up -d
```
注意：Docker 下载的镜像较大，请确保有足够的存储空间（约 10 GB）。
确认服务器状态：服务器启动成功后，通过以下命令确认服务器状态：
```
docker logs -f ragflow-server
```
安装完成后，访问 http://localhost:80 进行注册和登录，而不是访问以下两个地址：
- http://127.0.0.1:9380
- http://172.18.0.6:9380
正确的访问地址如下图所示：

注册与登录

在上图的界面中完成注册，并登录至如下页面：

配置 Ollama 以连接大模型

接下来，我们配置模型。点击右上角的头像，然后选择“模型提供商”：

在这里，我选择连接已经在本地部署的 Ollama，并通过 Ollama 安装了 Qwen2 大模型。如果需要参考具体的安装步骤，请移步到之前的文章。

启动 Ollama 大模型的命令如下：

ollama serve

当然，您也可以选择其他平台和模型，并提供相应的 API key。许多模型的 API 都提供免费额度，可以根据需要选择。

在 RagFlow 中配置模型时，由于 RagFlow 是通过 Docker 安装的，因此需要使用以下地址连接本地部署的 Ollama：

http://host.docker.internal:11434

创建知识库

配置完成后，就可以创建知识库了：

注意，尽管界面中没有显示 Markdown 文件类型，但经过测试，Markdown 文件也是支持的。其他选项根据具体情况自行配置即可，操作非常简单。

文件上传后可能处理较慢，这取决于电脑的配置。

文件处理完成后，可以通过检索测试确认文件是否被正确索引。

至此，如果所有文件上传完成，知识库的创建工作也就告一段落了。

聊天功能

现在可以展示成果了，您可以基于知识库与模型进行自然语言交互。

首先，请确保在聊天配置中将 token 设置为较大值，以获得更详细的回复。我将其设置为最大值。

以下是测试结果：

我对结果还算满意。由于我的笔记本配置较低，且没有显卡支持，运行速度较慢。如果部署在有 GPU 的服务器上，企业私有化部署供内部使用，速度会快得多。

思考

在本文的示例中，我使用了个人笔记本上的资料构建个人知识库。无论是基于摘要总结，还是全文检索，所得答案都基本可以满足需求。但这是面向个人或 C 端的应用场景，对于 B 端或企业场景，仅依靠向量检索是远远不够的。首先，它无法准确召回特定信息；其次，它也无法与企业内部的信息系统（包含大量结构化数据）有效集成。

要解决这个问题，除了采用多路召回和重排序策略外，业界还提出了其他解决方案。例如，infiniFlow 提出的 Infinity AI 原生数据库：

如图所示，AI 原生数据库不仅涵盖非结构化内容（如文档和图片），还包括结构化信息系统。通过有效整合这些信息，基于此实现多路召回和融合排序的解决方案。

此外，虽然许多 AI 产品的上下文长度越来越长，但在知识库问答场景中，RAG 仍然是非常必要的。LLM 的长上下文能力实际上对 RAG 的发展有很大促进作用。正如 OpenAI 联合创始人 Andrej Karpathy 所比喻的那样，LLM 就像计算机的 CPU，而上下文就像内存，而以向量为代表的数据库则是硬盘。

显然，没有硬盘的计算机是不可想象的。尽管内存可以很大，但成本高昂，短时间内也无法替代硬盘的作用。

最后关于准确性问题，通常有两个解决思路：一是针对 RAG 系统进行改进，例如进行 Embedding 模型的微调；二是对 LLM 进行微调。虽然我并未亲自实践过，但从阅读的资料来看，RAG 系统在实时性和成本方面相比 LLM 微调更具优势，因此更受青睐。这一点与我的直觉一致。

参考资料

END

本文作者： Kevin Zhang
文章标题：通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南
本文地址： https://www.haovps.top/archives/285.html
版权说明：若无注明，本文皆高性能VPS推荐与IT技术博客 | Haovps.Top 原创，转载请保留文章出处。

最后修改：2024 年 12 月 16 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

打卡

语录

私密评论

名称 *

🎲

邮箱 *

地址

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

Kevin Zhang • 2024 年 08 月 11 日

<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/c472b2eafa35751ff70eda95f2e59c43.webp"><h2>前言</h2>在上一篇<a href="https://www.haovps.top/archives/284.html" target="_blank" target="_blank" >文章</a>中，我们介绍了如何使用<code>RAG技术</code>构建<a href="https://www.haovps.top/tag/%E6%9C%AC%E5%9C%B0%E7%9F%A5%E8%AF%86%E5%BA%93/"target="_self" title="本地知识库">本地知识库</a>，基于 <a href="https://www.haovps.top/tag/Ollama/"target="_self" title="Ollama">Ollama</a> 和 <a href="https://www.haovps.top/tag/Qwen2-5/"target="_self" title="Qwen2.5">Qwen2.5</a> 实现了与本地<a href="https://www.haovps.top/tag/%E7%A7%81%E6%9C%89%E7%9F%A5%E8%AF%86%E5%BA%93/"target="_self" title="私有知识库">私有知识库</a>文件的自然语言交互。本文将继续探讨另一种实现方式，即通过 Ollama 与 <a href="https://www.haovps.top/tag/RagFlow/"target="_self" title="RagFlow">RagFlow</a> 的组合来实现，其中 Ollama 使用的模型仍然是<code>Qwen2</code>。首先，让我们回顾一下 <a href="https://www.haovps.top/tag/RAG/"target="_self" title="RAG">RAG</a> 的常见应用架构：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/1c585768a21516fe8b86c22cdc56b329.webp"><h2>RagFlow 的安装和部署</h2><h3>前置条件</h3>为了成功安装和运行 RagFlow，您的系统应满足以下要求：<ul><li>CPU：至少 4 核</li><li>内存：至少 16 GB</li><li>磁盘空间：至少 50 GB</li><li>Docker：版本 &gt;= 24.0.0 & <a href="https://www.haovps.top/tag/Docker-Compose/"target="_self" title="Docker Compose">Docker Compose</a> &gt;= v2.26.1</li></ul><h3>安装步骤</h3><ol><li>克隆仓库：<pre><code class="lang-bash">git clone https://github.com/infiniflow/ragflow.git</code></pre></li><li>启动服务器：进入 <code>docker</code> 文件夹，并使用预编译的 <a href="https://www.haovps.top/tag/Docker/"target="_self" title="Docker">Docker</a> <a href="https://www.haovps.top/tag/%E9%95%9C%E5%83%8F/"target="_self" title="镜像">镜像</a>启动服务器：<pre><code class="lang-bash">cd ragflow/docker
chmod +x ./entrypoint.sh
docker compose -f docker-compose-CN.yml up -d</code></pre>注意：Docker 下载的镜像较大，请确保有足够的存储空间（约 10 GB）。</li><li>确认服务器状态：服务器启动成功后，通过以下<a href="https://www.haovps.top/tag/%E5%91%BD%E4%BB%A4/"target="_self" title="命令">命令</a>确认服务器状态：<pre><code class="lang-bash">docker logs -f ragflow-server</code></pre><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/5a3ca2fd0389dbdcda9533756f4c1649.webp">安装完成后，访问 <code>http://localhost:80</code> 进行注册和登录，而不是访问以下两个地址：<ul><li><a href="https://www.haovps.top/go/aHR0cDovLzEyNy4wLjAuMTo5Mzgw" target="_blank" >http://127.0.0.1:9380</a></li><li><a href="https://www.haovps.top/go/aHR0cDovLzE3Mi4xOC4wLjY6OTM4MA" target="_blank" >http://172.18.0.6:9380</a></li></ul>正确的访问地址如下图所示：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/b934b13ebef9bda1495902d0e368bb0f.webp"></li></ol><h3>注册与登录</h3>在上图的界面中完成注册，并登录至如下页面：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/98328e536655303f0a884798796c75f7.webp"><h2>配置 Ollama 以连接<a href="https://www.haovps.top/tag/%E5%A4%A7%E6%A8%A1%E5%9E%8B/"target="_self" title="大模型">大模型</a></h2>接下来，我们配置模型。点击右上角的头像，然后选择“模型提供商”：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/0f57bf9ac4a5b424bd2ff5822162460f.webp">在这里，我选择连接已经在<a href="https://www.haovps.top/tag/%E6%9C%AC%E5%9C%B0%E9%83%A8%E7%BD%B2/"target="_self" title="本地部署">本地部署</a>的 Ollama，并通过 Ollama 安装了 Qwen2 大模型。如果需要参考具体的安装步骤，请移步到<a href="https://www.haovps.top/archives/284.html" target="_blank" target="_blank" >之前的文章</a>。启动 Ollama 大模型的命令如下：<pre><code class="lang-bash">ollama serve</code></pre>当然，您也可以选择其他平台和模型，并提供相应的 API key。许多模型的 API 都提供<a href="https://www.haovps.top/tag/%E5%85%8D%E8%B4%B9/"target="_self" title="免费">免费</a>额度，可以根据需要选择。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/e0c503821b73eeb5013588bb0439d00d.webp">在 RagFlow 中配置模型时，由于 RagFlow 是通过 Docker 安装的，因此需要使用以下地址连接本地部署的 Ollama：<pre><code class="lang-plaintext">http://host.docker.internal:11434</code></pre><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/d7b3e8fd7caf33833cbb6f1e8baaa124.webp"><h2>创建<a href="https://www.haovps.top/tag/%E7%9F%A5%E8%AF%86%E5%BA%93/"target="_self" title="知识库">知识库</a></h2>配置完成后，就可以创建知识库了：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/02d6dfab0b528e74aa8c7319b9897e45.webp">注意，尽管界面中没有显示 <code>Markdown</code> 文件类型，但经过测试，<code>Markdown</code> 文件也是支持的。其他选项根据具体情况自行配置即可，操作非常简单。文件上传后可能处理较慢，这取决于电脑的配置。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/b50cfcb72c410c8de758011e8e316774.webp">文件处理完成后，可以通过检索测试确认文件是否被正确索引。至此，如果所有文件上传完成，知识库的创建工作也就告一段落了。<h2>聊天功能</h2>现在可以展示成果了，您可以基于知识库与模型进行自然语言交互。首先，请确保在聊天配置中将 <code>token</code> 设置为较大值，以获得更详细的回复。我将其设置为最大值。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/d48aeb87ed51cdbfa87b9276e8e5d066.webp">以下是测试结果：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/0a135acf952f712ffbbab6efc10d2b73.webp">我对结果还算满意。由于我的<a href="https://www.haovps.top/tag/%E7%AC%94%E8%AE%B0/"target="_self" title="笔记">笔记</a>本配置较低，且没有显卡支持，运行速度较慢。如果部署在有 GPU 的服务器上，企业<a href="https://www.haovps.top/tag/%E7%A7%81%E6%9C%89%E5%8C%96%E9%83%A8%E7%BD%B2/"target="_self" title="私有化部署">私有化部署</a>供内部使用，速度会快得多。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/a2da2d5779042b6e543a536939da6c1e.webp"><h2>思考</h2>在本文的示例中，我使用了个人笔记本上的资料构建个人知识库。无论是基于摘要总结，还是全文检索，所得答案都基本可以满足需求。但这是面向个人或 C 端的应用场景，对于 B 端或企业场景，仅依靠向量检索是远远不够的。首先，它无法准确召回特定信息；其次，它也无法与企业内部的信息系统（包含大量结构化数据）有效集成。要解决这个问题，除了采用多路召回和重排序策略外，业界还提出了其他解决方案。例如，infiniFlow 提出的 Infinity <a href="https://www.haovps.top/tag/AI/"target="_self" title="AI">AI</a> 原生数据库：<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/862c203a975f2c790d4007f19c99c11a.webp">如图所示，AI 原生数据库不仅涵盖非结构化内容（如文档和图片），还包括结构化信息系统。通过有效整合这些信息，基于此实现多路召回和融合排序的解决方案。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/dd4b249808ea4a01840f98bf5b17d959.webp">此外，虽然许多 AI 产品的上下文长度越来越长，但在知识库问答场景中，RAG 仍然是非常必要的。LLM 的长上下文能力实际上对 RAG 的发展有很大促进作用。正如 <a href="https://www.haovps.top/tag/OpenAI/"target="_self" title="OpenAI">OpenAI</a> 联合创始人 Andrej Karpathy 所比喻的那样，LLM 就像计算机的 CPU，而上下文就像内存，而以向量为代表的数据库则是硬盘。<img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/2666242c154c711ac71ff76803a29e2b.webp">显然，没有硬盘的计算机是不可想象的。尽管内存可以很大，但成本高昂，短时间内也无法替代硬盘的作用。最后关于准确性问题，通常有两个解决思路：一是针对 RAG 系统进行改进，例如进行 Embedding 模型的微调；二是对 LLM 进行微调。虽然我并未亲自实践过，但从阅读的资料来看，RAG 系统在实时性和成本方面相比 LLM 微调更具优势，因此更受青睐。这一点与我的直觉一致。<h2>参考资料</h2><ul><li><a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL2luZmluaWZsb3cvcmFnZmxvdy9ibG9iL21haW4vUkVBRE1FX3poLm1k" target="_blank" >https://github.com/infiniflow/ragflow/blob/main/README_zh.md</a></li><li><a href="https://www.haovps.top/go/aHR0cHM6Ly9pbmZpbmlmbG93Lm9yZy9ibG9nL2RhdGFiYXNlLWZvci1yYWc" target="_blank" >https://infiniflow.org/blog/database-for-rag</a></li></ul><hr>

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

前言

RagFlow 的安装和部署

前置条件

安装步骤

注册与登录

配置 Ollama 以连接大模型

创建知识库

聊天功能

思考

参考资料

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

OpenWrt 固件上安装 SSRplus、Passwall 和 Hello World 插件的详细教程

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

OpenWrt 安装与配置 AdGuard Home 实现全局广告拦截的详细教程

2025年最新OpenClash安装与配置指南

NeoVim：Vim用户的现代化编辑器选择

使用Docker部署mailcow，自建邮局服务（一）

ZFile：功能强大的在线网盘和文件管理系统

将 Perplexity 和 ChatGPT 添加为浏览器搜索引擎的完整指南

DeepSeek - R1 本地搭建与体验指南

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

前言

RagFlow 的安装和部署

前置条件

安装步骤

注册与登录

配置 Ollama 以连接大模型

创建知识库

聊天功能

思考

参考资料

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款