本地运行大型语言模型（LLM）的25个工具

博主： Kevin Zhang
发布时间：2024 年 08 月 19 日
384 次浏览
暂无评论
3908字数
分类： IT技术人工智能

在本地运行大型语言模型（LLM）的世界中，LMStudio、Ollama、Jan.ai和HuggingFace等工具各展所长，提供了从桌面应用到开源模型支持的多样化解决方案。这些工具不仅易于使用，还强调了隐私保护和本地处理能力，让AI技术更加贴近用户的日常需求。

本文介绍了在本地运行大型语言模型（LLM）的25个工具。

1. LMStudio

LMStudio 是一个桌面应用程序，用户可以在本地电脑上运行和操作大型语言模型。它支持多种模型，并且注重隐私保护，无需将数据发送到远程服务器。

链接：LMStudio

2. Ollama

Ollama 是一款本地运行开源大型语言模型的工具，支持包括 Llama 3 和 Code Llama 在内的多种模型。它通过整合模型权重、配置和所需数据到一个 Modelfile 中，简化了模型部署和管理过程。

链接：Ollama

3. Hugging Face 和 Transformers

Hugging Face 是机器学习和人工智能领域的开源模型集散地，类似于 Docker Hub，提供了丰富的开源模型资源。此外，Hugging Face 的 transformers 库极大地简化了在本地部署和运行大型语言模型（LLM）的流程。

链接：Hugging Face

4. LangChain

LangChain 是一个用于构建 AI 应用程序的 Python 框架。通过提供抽象层和中间件，它使开发者能够便捷地在其支持的各种模型基础上开发 AI 应用。

链接：LangChain

5. Llama.cpp

Llama.cpp 是基于 C 和 C++ 开发的大型语言模型（LLM）推理引擎，特别为苹果硅芯片进行了性能优化，并能够高效运行 Meta 公司推出的 Llama2 模型。

链接：Llama.cpp

6. Lamafile

Mozilla 开发的 Lamafile 提供了一种便捷友好的方式来运行大型语言模型（LLMs），以其便携性和生成单文件可执行程序的特性而受到用户青睐。

链接：Lamafile

7. Jan.ai

Jan 能够将您的电脑转化为一台 AI 驱动的智能设备，通过在本地运行大型语言模型（LLMs），提供了一个以隐私保护为核心、优先考虑本地处理能力、并且完全开源的解决方案。

链接：Jan.ai

8. llm

LLM 是一个易用的工具，由 Simon Willison 开发，即使是编程新手也能轻松上手。它提供了一种简便的方法，允许用户在自己的计算机上下载和使用开源的大型语言模型（LLMs）。

链接：LLM

9. GPT4ALL

GPT4ALL 是一个易于使用的桌面应用程序，具有直观的 GUI。它支持本地模型运行，并提供与 OpenAI 的 API 密钥连接。

链接：GPT4ALL

10. H2OGPT

h2oGPT 简化了创建私人大型语言模型（LLM）的过程，集成了大型语言模型、嵌入模型和一个专用于文档嵌入的数据库，并提供了命令行和图形用户界面两种操作方式。

链接：H2OGPT

11. LocalLLM

LocalLLM 是开源的，允许用户在自己的计算机上直接运行大型语言模型，无需依赖远程服务器。

链接：LocalLLM

12. Koboldcpp

Koboldcpp 是一个开源项目，提供最新版本的下载，允许用户在本地运行大型语言模型，以实现高效的文本生成和处理。

链接：Koboldcpp

13. LocalAI

LocalAI 是一个免费的、开源的 OpenAI 替代品，它作为一个与 OpenAI API 规范兼容的 REST API 替代品，用于本地 AI 推理。

链接：LocalAI

14. EXUI

EXUI 是一个简单、轻量级的基于浏览器的 UI，用于使用 ExLlamaV2 运行本地推理。

链接：EXUI

15. vLLM

vLLM 是一个快速且易于使用的 LLM 推理和服务库，安装非常简单。

链接：vLLM

16. MLX

MLX 是苹果公司机器学习研究团队推出的一个用于机器学习研究的数组框架，专为优化苹果硬件上的性能而设计，并支持用户在本地部署和运行自己的大型语言模型（LLMs）。

链接：MLX

17. CTranslate2

CTranslate2 是一个 C++ 和 Python 库，用于高效执行 Transformer 模型的推理任务。

链接：CTranslate2

18. Pinokio

Pinokio 是一个提供多样化解决方案的平台，不仅限于托管大型语言模型（LLMs），还为用户提供更广泛的 AI 应用和服务。

链接：Pinokio

19. PowerInfer

PowerInfer 是一款 CPU/GPU 大型语言模型（LLM）推理引擎，通过利用激活局部性技术，优化模型在设备上的性能。

链接：PowerInfer

20. LlamaSharp

LlamaSharp 是对 llama.cpp 的 C#/.NET 语言绑定，为用户提供了一套高级 API，用于推理 LLaMA 模型。

链接：LlamaSharp

21. LMQL

LMQL 是一个可以本地安装的编程语言，提供了一个基于 Web 的 Playground IDE 供用户使用。

链接：LMQL

22. AvaPLS

Ava PLS 是一个开源桌面应用程序，可以在电脑上本地运行语言模型。

链接：AvaPLS

23. LiteLLM

LiteLLM 是一个轻量级的库，允许用户以 OpenAI 的格式统一调用各种大型语言模型（LLM）的 API。

链接：LiteLLM

24. HammerAI

HammerAI 不是一个典型的 LLM 应用程序，而是一个提供聊天体验的平台，通过 HammerAI，用户可以在自己的浏览器中与本地运行的角色扮演 AI 角色进行对话。

链接：HammerAI

25. Bedrock/VertexAI

Bedrock 和 VertexAI 是由 Google 和 Amazon 提供的解决方案，它们支持在云平台上高效托管和运行大型语言模型（LLMs）。

链接：Bedrock | VertexAI

END

本文作者： Kevin Zhang
文章标题：本地运行大型语言模型（LLM）的25个工具
本文地址： https://www.haovps.top/archives/288.html
版权说明：若无注明，本文皆高性能VPS推荐与IT技术博客 | Haovps.Top 原创，转载请保留文章出处。

最后修改：2024 年 12 月 16 日

如果觉得我的文章对你有用，请随意赞赏

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

评论 *

打卡

语录

私密评论

名称 *

🎲

邮箱 *

地址

本地运行大型语言模型（LLM）的25个工具

Kevin Zhang • 2024 年 08 月 19 日

<p><img src="https://www.haovps.top/usr/themes/handsome/assets/img/loading.svg" alt="" title="" style=""data-original="//www.haovps.top/usr/uploads/auto_save_image/d01b1dfe90a7009ca732c6cfcad52e7f.webp"></p><p>在本地运行<a href="https://www.haovps.top/tag/%E5%A4%A7%E5%9E%8B%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B/"target="_self" title="大型语言模型">大型语言模型</a>（LLM）的世界中，LMStudio、<a href="https://www.haovps.top/tag/Ollama/"target="_self" title="Ollama">Ollama</a>、Jan.ai和<strong>HuggingFace</strong>等工具各展所长，提供了从桌面应用到<a href="https://www.haovps.top/tag/%E5%BC%80%E6%BA%90/"target="_self" title="开源">开源</a>模型支持的多样化解决方案。这些工具不仅易于使用，还强调了<a href="https://www.haovps.top/tag/%E9%9A%90%E7%A7%81%E4%BF%9D%E6%8A%A4/"target="_self" title="隐私保护">隐私保护</a>和本地处理能力，让<a href="https://www.haovps.top/tag/AI%E6%8A%80%E6%9C%AF/"target="_self" title="AI技术">AI技术</a>更加贴近用户的日常需求。</p><p>本文介绍了在本地运行大型语言模型（LLM）的25个工具。</p><h2>1. LMStudio</h2><p>LMStudio 是一个桌面应用程序，用户可以在本地电脑上运行和操作大型语言模型。它支持多种模型，并且注重隐私保护，无需将数据发送到远程服务器。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9sbXN0dWRpby5haS8" target="_blank" >LMStudio</a></p><h2>2. Ollama</h2><p>Ollama 是一款本地运行开源大型语言模型的工具，支持包括 Llama 3 和 <strong>Code Llama</strong> 在内的多种模型。它通过整合模型权重、配置和所需数据到一个 Modelfile 中，简化了模型部署和管理过程。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9vbGxhbWEuY29tLw" target="_blank" >Ollama</a></p><h2>3. Hugging Face 和 Transformers</h2><p><strong>Hugging Face</strong> 是<a href="https://www.haovps.top/tag/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/"target="_self" title="机器学习">机器学习</a>和<a href="https://www.haovps.top/ai"target="_self" title="人工智能">人工智能</a>领域的开源模型集散地，类似于 <a href="https://www.haovps.top/tag/Docker/"target="_self" title="Docker">Docker</a> Hub，提供了丰富的开源模型资源。此外，Hugging Face 的 <code>transformers</code> 库极大地简化了在<a href="https://www.haovps.top/tag/%E6%9C%AC%E5%9C%B0%E9%83%A8%E7%BD%B2/"target="_self" title="本地部署">本地部署</a>和运行大型语言模型（LLM）的流程。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9odWdnaW5nZmFjZS5jby9taWNyb3NvZnQvcGhpLTI" target="_blank" >Hugging Face</a></p><h2>4. LangChain</h2><p>LangChain 是一个用于构建 <a href="https://www.haovps.top/tag/AI/"target="_self" title="AI">AI</a> 应用程序的 <a href="https://www.haovps.top/tag/Python/"target="_self" title="Python">Python</a> 框架。通过提供抽象层和中间件，它使开发者能够便捷地在其支持的各种模型基础上开发 AI 应用。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly93d3cubGFuZ2NoYWluLmNvbS8" target="_blank" >LangChain</a></p><h2>5. Llama.cpp</h2><p>Llama.cpp 是基于 C 和 C++ 开发的大型语言模型（LLM）推理引擎，特别为苹果硅芯片进行了性能<a href="https://www.haovps.top/tag/%E4%BC%98%E5%8C%96/"target="_self" title="优化">优化</a>，并能够高效运行 <a href="https://www.haovps.top/tag/Meta/"target="_self" title="Meta">Meta</a> 公司推出的 Llama2 模型。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL2dnZXJnYW5vdi9sbGFtYS5jcHA" target="_blank" >Llama.cpp</a></p><h2>6. Lamafile</h2><p>Mozilla 开发的 Lamafile 提供了一种便捷友好的方式来运行大型语言模型（LLMs），以其便携性和生成单文件可执行程序的特性而受到用户青睐。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL01vemlsbGEtT2Noby9sbGFtYWZpbGU" target="_blank" >Lamafile</a></p><h2>7. Jan.ai</h2><p>Jan 能够将您的电脑转化为一台 AI 驱动的智能设备，通过在本地运行大型语言模型（LLMs），提供了一个以隐私保护为核心、优先考虑本地处理能力、并且完全开源的解决方案。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9qYW4uYWkv" target="_blank" >Jan.ai</a></p><h2>8. llm</h2><p>LLM 是一个易用的工具，由 Simon Willison 开发，即使是编程新手也能轻松上手。它提供了一种简便的方法，允许用户在自己的计算机上下载和使用开源的大型语言模型（LLMs）。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL3NpbW9udy9sbG0" target="_blank" >LLM</a></p><h2>9. GPT4ALL</h2><p>GPT4ALL 是一个易于使用的桌面应用程序，具有直观的 GUI。它支持本地模型运行，并提供与 <a href="https://www.haovps.top/tag/OpenAI/"target="_self" title="OpenAI">OpenAI</a> 的 API 密钥连接。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9ncHQ0YWxsLmlvL2luZGV4Lmh0bWw" target="_blank" >GPT4ALL</a></p><h2>10. H2OGPT</h2><p>h2oGPT 简化了创建私人大型语言模型（LLM）的过程，集成了大型语言模型、<a href="https://www.haovps.top/tag/%E5%B5%8C%E5%85%A5%E6%A8%A1%E5%9E%8B/"target="_self" title="嵌入模型">嵌入模型</a>和一个专用于文档嵌入的数据库，并提供了<a href="https://www.haovps.top/tag/%E5%91%BD%E4%BB%A4/"target="_self" title="命令">命令</a>行和图形用户界面两种操作方式。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL2gyb2FpL2gyb2dwdA" target="_blank" >H2OGPT</a></p><h2>11. LocalLLM</h2><p>LocalLLM 是开源的，允许用户在自己的计算机上直接运行大型语言模型，无需依赖远程服务器。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL0dvb2dsZUNsb3VkUGxhdGZvcm0vbG9jYWxsbG0" target="_blank" >LocalLLM</a></p><h2>12. Koboldcpp</h2><p>Koboldcpp 是一个<a href="https://www.haovps.top/tag/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/"target="_self" title="开源项目">开源项目</a>，提供最新版本的下载，允许用户在本地运行大型语言模型，以实现高效的文本生成和处理。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL0xvc3RSdWlucy9rb2JvbGRjcHAvcmVsZWFzZXM" target="_blank" >Koboldcpp</a></p><h2>13. LocalAI</h2><p>LocalAI 是一个<a href="https://www.haovps.top/tag/%E5%85%8D%E8%B4%B9/"target="_self" title="免费">免费</a>的、开源的 OpenAI 替代品，它作为一个与 OpenAI API 规范兼容的 <a href="https://www.haovps.top/tag/REST-API/"target="_self" title="REST API">REST API</a> 替代品，用于本地 AI 推理。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL211ZGxlci9Mb2NhbEFJ" target="_blank" >LocalAI</a></p><h2>14. EXUI</h2><p>EXUI 是一个简单、<a href="https://www.haovps.top/tag/%E8%BD%BB%E9%87%8F%E7%BA%A7/"target="_self" title="轻量级">轻量级</a>的基于浏览器的 UI，用于使用 ExLlamaV2 运行本地推理。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL3R1cmJvZGVycC9leHVp" target="_blank" >EXUI</a></p><h2>15. vLLM</h2><p>vLLM 是一个快速且易于使用的 LLM 推理和服务库，安装非常简单。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL3ZsbG0tcHJvamVjdC92bGxt" target="_blank" >vLLM</a></p><h2>16. MLX</h2><p>MLX 是苹果公司机器学习研究团队推出的一个用于机器学习研究的数组框架，专为优化苹果硬件上的性能而设计，并支持用户在本地部署和运行自己的大型语言模型（LLMs）。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL21sLWV4cGxvcmUvbWx4" target="_blank" >MLX</a></p><h2>17. CTranslate2</h2><p>CTranslate2 是一个 C++ 和 Python 库，用于高效执行 Transformer 模型的推理任务。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL09wZW5OTVQvQ1RyYW5zbGF0ZTI" target="_blank" >CTranslate2</a></p><h2>18. Pinokio</h2><p>Pinokio 是一个提供多样化解决方案的平台，不仅限于托管大型语言模型（LLMs），还为用户提供更广泛的 AI 应用和服务。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9waW5va2lvLmNvbXB1dGVyLw" target="_blank" >Pinokio</a></p><h2>19. PowerInfer</h2><p>PowerInfer 是一款 CPU/GPU 大型语言模型（LLM）推理引擎，通过利用激活局部性技术，优化模型在设备上的性能。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL1NKVFUtSVBBRFMvUG93ZXJJbmZlcg" target="_blank" >PowerInfer</a></p><h2>20. LlamaSharp</h2><p>LlamaSharp 是对 llama.cpp 的 C#/.NET 语言绑定，为用户提供了一套高级 API，用于推理 LLaMA 模型。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL1NjaVNoYXJwL0xMYW1hU2hhcnA" target="_blank" >LlamaSharp</a></p><h2>21. LMQL</h2><p>LMQL 是一个可以本地安装的编程语言，提供了一个基于 Web 的 Playground IDE 供用户使用。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9sbXFsLmFpL3BsYXlncm91bmQv" target="_blank" >LMQL</a></p><h2>22. AvaPLS</h2><p>Ava PLS 是一个开源桌面应用程序，可以在电脑上本地运行语言模型。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9hdmFwbHMuY29tLw" target="_blank" >AvaPLS</a></p><h2>23. LiteLLM</h2><p>LiteLLM 是一个轻量级的库，允许用户以 OpenAI 的格式统一调用各种大型语言模型（LLM）的 API。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9naXRodWIuY29tL0JlcnJpQUkvbGl0ZWxsbQ" target="_blank" >LiteLLM</a></p><h2>24. HammerAI</h2><p>HammerAI 不是一个典型的 LLM 应用程序，而是一个提供聊天体验的平台，通过 HammerAI，用户可以在自己的浏览器中与本地运行的角色扮演 AI 角色进行对话。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly93d3cuaGFtbWVyYWkuY29tLw" target="_blank" >HammerAI</a></p><h2>25. Bedrock/VertexAI</h2><p>Bedrock 和 VertexAI 是由 <a href="https://www.haovps.top/tag/Google/"target="_self" title="Google">Google</a> 和 Amazon 提供的解决方案，它们支持在云平台上高效托管和运行大型语言模型（LLMs）。</p><p>链接：<a href="https://www.haovps.top/go/aHR0cHM6Ly9hd3MuYW1hem9uLmNvbS9iZWRyb2NrLw" target="_blank" >Bedrock</a> | <a href="https://www.haovps.top/go/aHR0cHM6Ly9jbG91ZC5nb29nbGUuY29tL3ZlcnRleC1haQ" target="_blank" >VertexAI</a></p><hr>

本地运行大型语言模型（LLM）的25个工具

1. LMStudio

2. Ollama

3. Hugging Face 和 Transformers

4. LangChain

5. Llama.cpp

6. Lamafile

7. Jan.ai

8. llm

9. GPT4ALL

10. H2OGPT

11. LocalLLM

12. Koboldcpp

13. LocalAI

14. EXUI

15. vLLM

16. MLX

17. CTranslate2

18. Pinokio

19. PowerInfer

20. LlamaSharp

21. LMQL

22. AvaPLS

23. LiteLLM

24. HammerAI

25. Bedrock/VertexAI

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

OpenWrt 固件上安装 SSRplus、Passwall 和 Hello World 插件的详细教程

通过Ollama和RagFlow构建高效的本地知识库：从部署到应用的全流程指南

使用 Docker 安装 Ollama 部署本地大模型并接入 One-API

OpenWrt 安装与配置 AdGuard Home 实现全局广告拦截的详细教程

2025年最新OpenClash安装与配置指南

跨平台文件传输神器：LocalSend，让你的文件秒传到任意设备

使用Docker部署MrDoc：高效的在线文档管理系统

Ollama与Llama3集成Spring Boot：构建智能聊天应用的完整指南

Docker项目：快速部署 Teedy，实现高效文档管理

在Docker中运行Mac OS X：使用Docker-OSX实现跨平台开发与测试

本地运行大型语言模型（LLM）的25个工具

1. LMStudio

2. Ollama

3. Hugging Face 和 Transformers

4. LangChain

5. Llama.cpp

6. Lamafile

7. Jan.ai

8. llm

9. GPT4ALL

10. H2OGPT

11. LocalLLM

12. Koboldcpp

13. LocalAI

14. EXUI

15. vLLM

16. MLX

17. CTranslate2

18. Pinokio

19. PowerInfer

20. LlamaSharp

21. LMQL

22. AvaPLS

23. LiteLLM

24. HammerAI

25. Bedrock/VertexAI

发表评论 取消回复 使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款

本地运行大型语言模型（LLM）的25个工具

发表评论取消回复
使用cookie技术保留您的个人信息以便您下次快速评论，继续评论表示您已同意该条款