Open Interpreter 是一个创新工具,使大型语言模型能够在本地电脑上运行代码。首先,它提供了一个类似于 ChatGPT 的自然语言界面,让用户可以通过代码与电脑进行互动。以下是它的一些主要功能:
- 文件操作:创建和编辑各种类型的文件,如照片、视频和 PDF 等。
- 浏览器控制:控制 Chrome 浏览器进行研究和信息查找。
- 数据分析:分析数据集,根据需求提取信息。
工作原理:Open Interpreter 为语言模型配备了一个函数,支持在 Python、JavaScript 和 Shell 等语言中执行代码。它能将模型的消息、正在运行的代码以及系统的输出实时传输到你的终端。
目前,该项目在 GitHub 上已获得58.2k stars,地址为:GitHub - OpenInterpreter。
实践指南
安装和配置
您可以按照以下步骤在本地安装和使用 Open Interpreter:
创建 Python 虚拟环境并安装 Open Interpreter:
pip install open-interpreter
- 官方推荐使用 gpt-40,但为了便于国内的朋友体验,本文将以硅基流动提供的模型为例。硅基流动当前提供 DeepSeek-R1,并且邀注册用户可获得14元额度,链接如下:注册链接。
使用以下代码接入硅基流动的模型:
from interpreter import interpreter interpreter.llm.model = "openai/deepseek-ai/DeepSeek-V3" interpreter.llm.api_key = "sk-xxx" interpreter.llm.api_base = "https://api.siliconflow.cn/v1" interpreter.llm.context_window = 64000 # 启动互动聊天会话 interpreter.chat()
在实际使用中,第一个常见问题是您需要添加 openai
,以表明是与 OpenAI 兼容的模型,未添加时可能会出现错误。
示例操作
现在我们以一个简单的办公需求为例,展示 Open Interpreter 的效果。我在项目目录下放入了一个名为 test.xlsx
的 Excel 文件,内容如下:
示例问题1
问题:读取 test.xlsx
的内容,商品 A 的累计销量是多少?
根据模型的反馈,它会首先策划一个计划并询问是否同意执行代码。
由于假设列名是 "Product A",结果显示成功,累计销量为 82。
示例问题2
问题:读取 test.xlsx
的内容,画出一个以月份为横坐标、商品 B 为纵坐标的折线图,并能显示中文。
模型同样列出了执行步骤,并给出了代码。
绘图结果正确,如下所示。
对比不同模型的效果
在硅基流动平台上,您可以对比不同模型的效果,如:
- deepseek-ai/DeepSeek-V3
- meta-llama/Llama-3.3-70B-Instruct
- Qwen/Qwen2.5-72B-Instruct
可视化效果可以参考视频:AI 工具推荐——open-interpreter。
总结
Open Interpreter 是一个极具潜力的项目,提供了极高的可玩性。对编程感兴趣的朋友可以尝试将其与日常需求结合,以提升工作和生活的效率。
希望本篇文章能帮助到您!如有任何问题,请随时联系。