解释器为智能体提供了一个可编程工作区,可以在其中探索数据、协调工具调用,并将中间工作保留在模型上下文之外。智能体编写代码来表达其意图,然后内存中的运行时执行该代码并返回相关结果。 沙箱是一种以代码为先的方式来作用于环境(例如运行命令、安装依赖和编辑文件),而解释器是一种以代码为先的方式来作用于智能体循环内部:组合工具、保持状态,以及决定什么信息应该返回给模型。Documentation Index
Fetch the complete documentation index at: https://nvd-54.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
何时使用解释器
大多数智能体工作在模型推理和工具执行之间交替。这对简单操作有效,但当智能体需要组合许多步骤、对结构化数据进行推理或管理中间状态时就变得笨拙了。 解释器为智能体提供了一个运行时来完成这项工作。智能体可以编写一个小程序来运行控制流、调用允许列表中的工具、存储变量并向模型返回紧凑的结果,而不是让模型每次一个工具调用地选择下一步。 在以下情况使用解释器:- 用代码组合多个工具调用,包括循环、分支、重试和并发。
- 从代码中协调子智能体,将工作拆分为聚焦的调用、存储结果并将结果拼接成最终综合。
- 将中间值保存在运行时状态中,而不是将每个临时结果发送回模型上下文。
- 确定性地转换结构化数据,例如排序、分组、解析、验证、评分或聚合。
- 探索大型变量空间并仅向模型返回选定的证据、摘要或输出。
选择正确的执行路径
向智能体添加解释器
安装 QuickJS 中间件包,然后在创建智能体时添加中间件。在解释器中运行代码
中间件向智能体添加了一个eval 工具。该工具在持久化上下文中运行 TypeScript,捕获 console.log,并返回最后一个表达式的结果。
智能体可以编写如下代码:
程序化工具调用
程序化工具调用(PTC)将选定的智能体工具暴露在解释器的全局tools 命名空间下。智能体可以编写代码在循环、分支、重试或并行批次中调用工具,而不是让模型发出一个工具调用、等待结果,然后决定下一个调用。
当中间工具结果仅作为下一步的输入时,这很有用。解释器可以在任何内容返回到模型上下文之前处理、过滤或聚合这些结果,这可以使多工具/多步骤工作流更加 Token 高效。
PTC 在深度智能体中是模型无关的。它由中间件实现,而不是提供商特定的代码执行或工具调用 API。
工作原理
- 你用
ptc允许列表选择解释器可以调用哪些工具。 - 中间件将这些工具作为
tools下的异步 JavaScript 函数暴露。 - 智能体编写使用
await调用这些函数的解释器代码。 - 解释器运行工具桥接,接收工具结果并继续执行代码。
- 模型接收最终的解释器输出,而不是每个中间值。
web_search 的工具变为 tools.webSearch(...):
有用的模式
| 模式 | 解释器可以做什么 |
|---|---|
| 批处理 | 循环遍历多个输入并为每个调用工具。 |
| 并行工作 | 对独立调用使用 Promise.all。 |
| 条件逻辑 | 根据早期结果选择下一个工具调用。 |
| 提前终止 | 一旦满足成功条件就停止调用工具。 |
| 数据过滤 | 仅向模型返回相关的行、片段、错误或摘要。 |
| 递归编排 | 重复调用 task,然后在代码中组合子智能体结果。 |
启用 PTC
使用显式允许列表启用 PTC:递归语言模型
递归语言模型使用解释器作为分解的工作区。模型将大型输入或工作集保存在运行时变量中,编写代码检查和拆分它,对较小的片段调用子智能体或其他模型工具,然后在代码中将返回的结果拼接在一起。 这将变量空间与智能体的上下文分离。变量空间是存储在解释器中的信息,智能体的上下文是模型在下一次模型调用中实际处理的内容。模型可以决定哪些片段成为子智能体任务,哪些结果需要再次处理,以及什么最终综合应该返回到主对话。 有关此模式的背景,请参阅递归语言模型论文。 在深度智能体中,递归调用通常是通过程序化工具调用暴露的task 工具。解释器可以在多个切片上调用子智能体,组合其答案,并返回单个综合结果:
解释器技能
解释器技能是将代码模块暴露给解释器的技能。当与解释器中间件一起配置时,智能体可以从代码中导入这些模块并将它们用于确定性的辅助逻辑。 解释器技能在智能体需要用于结构化数据工作流的可复用辅助工具时很有用,例如排序、分组、评分、解析、验证或聚合数据。设置详情请参阅解释器技能。安全性和限制
解释器使用 QuickJS 运行不受信任的 JavaScript,具有严格的默认隔离。将其视为受限的解释器运行时,而不是完整的生产沙箱后端。 你通过 PTC 暴露的每个工具都是解释器代码可以使用的外部能力。将 PTC 允许列表视为权限边界:仅暴露智能体需要的工具,避免桥接可以访问敏感系统、花费金钱、修改数据或调用不受限制的网络的广泛工具,除非该行为是有意的。中间件选项
createCodeInterpreterMiddleware 接受以下选项:
| 选项 | 默认值 | 用途 |
|---|---|---|
ptc | 省略 | PTC 允许列表:工具名称或 StructuredToolInterface 实例数组。 |
memoryLimitBytes | 64 * 1024 * 1024 (64 MB) | QuickJS 内存限制(字节)。 |
maxStackSizeBytes | 320 * 1024 | QuickJS 栈大小限制(字节)。 |
executionTimeoutMs | 5000 | 每次 eval 的超时时间(毫秒)。负值禁用超时。 |
systemPrompt | null | 覆盖内置解释器系统提示。 |
skillsBackend | 省略 | 用于解析解释器技能模块的后端。 |
maxPtcCalls | 256 | 每次 eval 的最大 tools.* 调用次数。仅在受信任环境中使用 null。 |
maxResultChars | 4000 | 从控制台输出、结果和错误字符串中保留的最大字符数。 |
toolName | "eval" | 暴露给模型的解释器工具名称。 |
captureConsole | true | 是否捕获 console.log、console.warn 和 console.error 输出。 |
连接这些文档到 Claude、VSCode 等工具,通过 MCP 获取实时解答。

