LangGraph 思维方式 - Docs by LangChain

当你使用 LangGraph 构建智能体时，你首先会将其拆分为称为节点的离散步骤。然后，你将描述从每个节点出发的不同决策和转换。最后，你通过一个每个节点都可以读写的共享状态将节点连接在一起。在本演练中，我们将引导你完成使用 LangGraph 构建客户支持邮件智能体的思考过程。

从你要自动化的流程开始

假设你需要构建一个处理客户支持邮件的 AI 智能体。你的产品团队给了你这些需求：

智能体应该：

- 读取收到的客户邮件
- 按紧急程度和主题分类
- 搜索相关文档来回答问题
- 起草适当的回复
- 将复杂问题升级给人工客服
- 在需要时安排跟进

需要处理的示例场景：

1. 简单产品问题："如何重置密码？"
2. 缺陷报告："当我选择 PDF 格式时，导出功能崩溃了"
3. 紧急计费问题："我的订阅被重复收费了！"
4. 功能请求："你们能为移动应用添加深色模式吗？"
5. 复杂技术问题："我们的 API 集成间歇性地出现 504 错误"

要在 LangGraph 中实现智能体，你通常会遵循相同的五个步骤。

步骤 1：将工作流映射为离散步骤

首先确定流程中的不同步骤。每个步骤将成为一个节点（一个执行特定操作的函数）。然后，勾勒出这些步骤如何相互连接。此图中的箭头显示可能的路径，但实际选择哪条路径的决策发生在每个节点内部。现在我们已经确定了工作流中的组件，让我们了解每个节点需要做什么：

读取邮件：提取和解析邮件内容
分类意图：使用 LLM 对紧急程度和主题进行分类，然后路由到适当的操作
文档搜索：查询知识库获取相关信息
缺陷跟踪：在跟踪系统中创建或更新问题
起草回复：生成适当的回复
人工审核：升级给人工客服进行批准或处理
发送回复：发送邮件回复

注意某些节点会决定下一步去哪里（分类意图、起草回复、人工审核），而其他节点总是进入相同的下一步（读取邮件总是进入分类意图，文档搜索总是进入起草回复）。

步骤 2：确定每个步骤需要做什么

对于图中的每个节点，确定它代表什么类型的操作以及它需要什么上下文才能正常工作。

LLM 步骤

当你需要理解、分析、生成文本或做出推理决策时使用

数据步骤

当你需要从外部源检索信息时使用

操作步骤

当你需要执行外部操作时使用

用户输入步骤

当你需要人工干预时使用

LLM 步骤

当一个步骤需要理解、分析、生成文本或做出推理决策时：

分类意图

静态上下文（提示词）：分类类别、紧急程度定义、响应格式
动态上下文（来自状态）：邮件内容、发件人信息
期望结果：决定路由的结构化分类

起草回复

静态上下文（提示词）：语气指南、公司政策、回复模板
动态上下文（来自状态）：分类结果、搜索结果、客户历史
期望结果：准备好审核的专业邮件回复

数据步骤

当一个步骤需要从外部源检索信息时：

文档搜索

参数：根据意图和主题构建的查询
重试策略：是，使用指数退避处理暂时性故障
缓存：可以缓存常见查询以减少 API 调用

客户历史查找

参数：来自状态的客户邮箱或 ID
重试策略：是，但如果不可用则回退到基本信息
缓存：是，使用生存时间来平衡新鲜度和性能

操作步骤

当一个步骤需要执行外部操作时：

发送回复

何时执行节点：批准后（人工或自动）
重试策略：是，使用指数退避处理网络问题
不应缓存：每次发送是唯一操作

缺陷跟踪

何时执行节点：当意图为”缺陷”时始终执行
重试策略：是，不丢失缺陷报告至关重要
返回：要包含在回复中的工单 ID

用户输入步骤

当一个步骤需要人工干预时：

人工审核节点

决策上下文：原始邮件、回复草稿、紧急程度、分类
期望输入格式：批准布尔值加可选的编辑后回复
何时触发：高紧急程度、复杂问题或质量问题

步骤 3：设计你的状态

状态是智能体中所有节点都可访问的共享记忆。可以把它看作你的智能体在处理流程时用来跟踪它学到和决定的一切的笔记本。

什么应该放在状态中？

对每条数据问自己这些问题：

包含在状态中

它需要在步骤之间持续存在吗？如果是，它就应该在状态中。

不存储

你能从其他数据推导出它吗？如果是，在需要时计算它而不是存储在状态中。

对于我们的邮件智能体，我们需要跟踪：

原始邮件和发件人信息（以后无法重构这些）
分类结果（多个后续/下游节点需要）
搜索结果和客户数据（重新获取代价高昂）
回复草稿（需要在审核过程中持续存在）
执行元数据（用于调试和恢复）

保持状态原始，按需格式化提示词

一个关键原则：你的状态应该存储原始数据，而不是格式化的文本。在需要时在节点内部格式化提示词。

这种分离意味着：

不同节点可以根据需要以不同方式格式化相同数据
你可以更改提示词模板而无需修改状态模式
调试更清晰——你可以准确看到每个节点接收到了什么数据
你的智能体可以演进而不破坏现有状态

让我们定义我们的状态：

import { StateSchema } from "@langchain/langgraph";
import * as z from "zod";

// 定义邮件分类的结构
const EmailClassificationSchema = z.object({
  intent: z.enum(["question", "bug", "billing", "feature", "complex"]),
  urgency: z.enum(["low", "medium", "high", "critical"]),
  topic: z.string(),
  summary: z.string(),
});

const EmailAgentState = new StateSchema({
  // 原始邮件数据
  emailContent: z.string(),
  senderEmail: z.string(),
  emailId: z.string(),

  // 分类结果
  classification: EmailClassificationSchema.optional(),

  // 原始搜索/API 结果
  searchResults: z.array(z.string()).optional(),  // 原始文档块列表
  customerHistory: z.record(z.string(), z.any()).optional(),  // 来自 CRM 的原始客户数据

  // 生成的内容
  responseText: z.string().optional(),
});

type EmailClassificationType = z.infer<typeof EmailClassificationSchema>;

注意状态只包含原始数据——没有提示词模板，没有格式化的字符串，没有指令。分类输出作为单个字典存储，直接来自 LLM。

步骤 4：构建你的节点

现在我们将每个步骤实现为一个函数。LangGraph 中的节点只是一个接受当前状态并返回更新的 JavaScript 函数。

适当处理错误

不同的错误需要不同的处理策略：

错误类型	谁来修复	策略	何时使用
暂时性错误（网络问题、速率限制）	系统（自动）	重试策略	通常在重试时能解决的临时故障
LLM 可恢复错误（工具失败、解析问题）	LLM	将错误存储在状态中并循环回去	LLM 可以看到错误并调整方法
用户可修复错误（缺少信息、不明确的指令）	人工	使用 `interrupt()` 暂停	需要用户输入才能继续
重试后的可恢复故障	开发者（声明式）	`error_handler`	在重试耗尽后运行补偿/恢复分支
意外错误	开发者	让它们冒泡	需要调试的未知问题

暂时性错误
LLM 可恢复
用户可修复
意外错误
Saga / 补偿

添加重试策略以自动重试网络问题和速率限制。

import type { RetryPolicy } from "@langchain/langgraph";

workflow.addNode(
  "searchDocumentation",
  searchDocumentation,
  {
    retryPolicy: { maxAttempts: 3, initialInterval: 1.0 },
  },
);

将错误存储在状态中并循环回去，这样 LLM 可以看到出了什么问题并重试：

import { Command, GraphNode } from "@langchain/langgraph";

const executeTool: GraphNode<typeof State> = async (state, config) => {
  try {
    const result = await runTool(state.toolCall);
    return new Command({
      update: { toolResult: result },
      goto: "agent",
    });
  } catch (error) {
    // 让 LLM 看到出了什么问题并重试
    return new Command({
      update: { toolResult: `Tool error: ${error}` },
      goto: "agent"
    });
  }
}

在需要时暂停并从用户收集信息（如账户 ID、订单号或澄清）：

import { Command, GraphNode, interrupt } from "@langchain/langgraph";

const lookupCustomerHistory: GraphNode<typeof State> = async (state, config) => {
  if (!state.customerId) {
    const userInput = interrupt({
      message: "需要客户 ID",
      request: "请提供客户的账户 ID 以查找其订阅历史",
    });
    return new Command({
      update: { customerId: userInput.customerId },
      goto: "lookupCustomerHistory",
    });
  }
  // 现在继续查找
  const customerData = await fetchCustomerHistory(state.customerId);
  return new Command({
    update: { customerHistory: customerData },
    goto: "draftResponse",
  });
}

让它们冒泡以便调试。不要捕获你无法处理的错误：

import { Command, GraphNode } from "@langchain/langgraph";

const sendReply: GraphNode<typeof EmailAgentState> = async (state, config) => {
  try {
    await emailService.send(state.responseText);
  } catch (error) {
    throw error;  // 暴露意外错误
  }
}

实现我们的邮件智能体节点

我们将每个节点实现为一个简单的函数。记住：节点接受状态，执行工作，并返回更新。

读取和分类节点

import { StateGraph, START, END, GraphNode, Command } from "@langchain/langgraph";
import { HumanMessage } from "@langchain/core/messages";
import { ChatAnthropic } from "@langchain/anthropic";

const llm = new ChatAnthropic({ model: "claude-sonnet-4-6" });

const readEmail: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 提取和解析邮件内容
  // 在生产环境中，这将连接到你的邮件服务
  console.log(`Processing email: ${state.emailContent}`);
  return {};
}

const classifyIntent: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 使用 LLM 分类邮件意图和紧急程度，然后相应路由

  // 创建返回 EmailClassification 对象的结构化 LLM
  const structuredLlm = llm.withStructuredOutput(EmailClassificationSchema);

  // 按需格式化提示词，不存储在状态中
  const classificationPrompt = `
  分析此客户邮件并进行分类：

  邮件：${state.emailContent}
  发件人：${state.senderEmail}

  提供包括意图、紧急程度、主题和摘要的分类。
  `;

  // 直接获取结构化响应作为对象
  const classification = await structuredLlm.invoke(classificationPrompt);

  // 根据分类确定下一个节点
  let nextNode: "searchDocumentation" | "humanReview" | "draftResponse" | "bugTracking";

  if (classification.intent === "billing" || classification.urgency === "critical") {
    nextNode = "humanReview";
  } else if (classification.intent === "question" || classification.intent === "feature") {
    nextNode = "searchDocumentation";
  } else if (classification.intent === "bug") {
    nextNode = "bugTracking";
  } else {
    nextNode = "draftResponse";
  }

  // 将分类作为单个对象存储在状态中
  return new Command({
    update: { classification },
    goto: nextNode,
  });
}

搜索和跟踪节点

import { Command, GraphNode } from "@langchain/langgraph";

const searchDocumentation: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 搜索知识库获取相关信息

  // 从分类构建搜索查询
  const classification = state.classification!;
  const query = `${classification.intent} ${classification.topic}`;

  let searchResults: string[];

  try {
    // 在这里实现你的搜索逻辑
    // 存储原始搜索结果，不是格式化的文本
    searchResults = [
      "通过设置 > 安全 > 更改密码重置密码",
      "密码必须至少 12 个字符",
      "包含大写、小写、数字和符号",
    ];
  } catch (error) {
    // 对于可恢复的搜索错误，存储错误并继续
    searchResults = [`搜索暂时不可用：${error}`];
  }

  return new Command({
    update: { searchResults },  // 存储原始结果或错误
    goto: "draftResponse",
  });
}

const bugTracking: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 创建或更新缺陷跟踪工单

  // 在你的缺陷跟踪系统中创建工单
  const ticketId = "BUG-12345";  // 将通过 API 创建

  return new Command({
    update: { searchResults: [`已创建缺陷工单 ${ticketId}`] },
    goto: "draftResponse",
  });
}

回复节点

import { Command, interrupt } from "@langchain/langgraph";

const draftResponse: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 使用上下文生成回复并根据质量进行路由

  const classification = state.classification!;

  // 按需从原始状态数据格式化上下文
  const contextSections: string[] = [];

  if (state.searchResults) {
    // 为提示词格式化搜索结果
    const formattedDocs = state.searchResults.map(doc => `- ${doc}`).join("\n");
    contextSections.push(`相关文档：\n${formattedDocs}`);
  }

  if (state.customerHistory) {
    // 为提示词格式化客户数据
    contextSections.push(`客户层级：${state.customerHistory.tier ?? "standard"}`);
  }

  // 使用格式化的上下文构建提示词
  const draftPrompt = `
  为此客户邮件起草回复：
  ${state.emailContent}

  邮件意图：${classification.intent}
  紧急程度：${classification.urgency}

  ${contextSections.join("\n\n")}

  指南：
  - 保持专业和有帮助
  - 针对他们的具体问题
  - 在相关时使用提供的文档
  `;

  const response = await llm.invoke([new HumanMessage(draftPrompt)]);

  // 根据紧急程度和意图确定是否需要人工审核
  const needsReview = (
    classification.urgency === "high" ||
    classification.urgency === "critical" ||
    classification.intent === "complex"
  );

  // 路由到适当的下一个节点
  const nextNode = needsReview ? "humanReview" : "sendReply";

  return new Command({
    update: { responseText: response.content.toString() },  // 只存储原始回复
    goto: nextNode,
  });
}

const humanReview: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 使用 interrupt 暂停进行人工审核并根据决策路由
  const classification = state.classification!;

  // interrupt() 必须放在第一位——它之前的任何代码在恢复时都会重新运行
  const humanDecision = interrupt({
    emailId: state.emailId,
    originalEmail: state.emailContent,
    draftResponse: state.responseText,
    urgency: classification.urgency,
    intent: classification.intent,
    action: "请审核并批准/编辑此回复",
  });

  // 现在处理人工的决策
  if (humanDecision.approved) {
    return new Command({
      update: { responseText: humanDecision.editedResponse || state.responseText },
      goto: "sendReply",
    });
  } else {
    // 拒绝意味着人工将直接处理
    return new Command({ update: {}, goto: END });
  }
}

const sendReply: GraphNode<typeof EmailAgentState> = async (state, config) => {
  // 发送邮件回复
  // 与邮件服务集成
  console.log(`Sending reply: ${state.responseText!.substring(0, 100)}...`);
  return {};
}

步骤 5：将它们连接在一起

现在我们将节点连接成一个工作图。由于我们的节点处理自己的路由决策，我们只需要几条基本的边。要通过 interrupt() 启用人机协作，我们需要使用检查点编译以在运行之间保存状态：

图编译代码

import { MemorySaver, RetryPolicy } from "@langchain/langgraph";

// 创建图
const workflow = new StateGraph(EmailAgentState)
  // 添加带有适当错误处理的节点
  .addNode("readEmail", readEmail)
  .addNode("classifyIntent", classifyIntent)
  // 为可能有暂时性故障的节点添加重试策略
  .addNode(
    "searchDocumentation",
    searchDocumentation,
    { retryPolicy: { maxAttempts: 3 } },
  )
  .addNode("bugTracking", bugTracking)
  .addNode("draftResponse", draftResponse)
  .addNode("humanReview", humanReview)
  .addNode("sendReply", sendReply)
  // 只添加必要的边
  .addEdge(START, "readEmail")
  .addEdge("readEmail", "classifyIntent")
  .addEdge("sendReply", END);

// 使用检查点编译以实现持久化
const memory = new MemorySaver();
const app = workflow.compile({ checkpointer: memory });

图结构很简洁，因为路由通过节点内部的 Command 对象发生。每个节点声明它可以去哪里，使流程显式且可追踪。

试用你的智能体

让我们用一个需要人工审核的紧急计费问题运行我们的智能体：

测试智能体

// 使用紧急计费问题测试
const initialState: EmailAgentStateType = {
  emailContent: "I was charged twice for my subscription! This is urgent!",
  senderEmail: "customer@example.com",
  emailId: "email_123"
};

// 使用 thread_id 运行以实现持久化
const config = { configurable: { thread_id: "customer_123" } };
const result = await app.invoke(initialState, config);
// 图将在 human_review 处暂停
console.log(`Draft ready for review: ${result.responseText?.substring(0, 100)}...`);

import { Command } from "@langchain/langgraph";

// 准备好后，提供人工输入以恢复
const humanResponse = new Command({
  resume: {
    approved: true,
    editedResponse: "We sincerely apologize for the double charge. I've initiated an immediate refund...",
  }
});

// 恢复执行
const finalResult = await app.invoke(humanResponse, config);
console.log("Email sent successfully!");

当图遇到 interrupt() 时暂停，将所有内容保存到检查点，然后等待。它可以在数天后恢复，从完全相同的位置继续。thread_id 确保此对话的所有状态都被保存在一起。

总结和后续步骤

关键洞察

构建这个邮件智能体向我们展示了 LangGraph 的思维方式：

拆分为离散步骤

每个节点做好一件事。这种分解使得流式进度更新、可以暂停和恢复的持久执行，以及清晰的调试成为可能——你可以检查步骤之间的状态。

状态是共享记忆

存储原始数据，而不是格式化的文本。这让不同的节点可以以不同的方式使用相同的信息。

节点是函数

它们接受状态，执行工作，并返回更新。当它们需要做路由决策时，它们同时指定状态更新和下一个目的地。

错误是流程的一部分

暂时性故障获得重试，LLM 可恢复的错误带着上下文循环回去，用户可修复的问题暂停等待输入，意外错误冒泡以便调试。

人工输入是一等公民

interrupt() 函数无限期暂停执行，保存所有状态，并在你提供输入时从完全相同的位置恢复。当与节点中的其他操作结合使用时，它必须放在第一位。

图结构自然涌现

你定义基本连接，节点处理自己的路由逻辑。这使控制流显式且可追踪——你总是可以通过查看当前节点来理解智能体下一步会做什么。

高级考虑

节点粒度权衡

本节探讨节点粒度设计中的权衡。大多数应用可以跳过此部分，使用上面展示的模式。

你可能会想：为什么不把 读取邮件 和 分类意图 合并成一个节点？或者为什么要把文档搜索和起草回复分开？答案涉及弹性和可观测性之间的权衡。弹性考虑： LangGraph 的持久执行在节点边界创建检查点。当工作流在中断或故障后恢复时，它从执行停止处的节点开头开始。更小的节点意味着更频繁的检查点，这意味着如果出现问题，需要重复的工作更少。如果你将多个操作合并到一个大节点中，接近末尾的故障意味着从该节点开头重新执行所有内容。我们为邮件智能体选择此分解方式的原因：

外部服务的隔离： 文档搜索和缺陷跟踪是单独的节点，因为它们调用外部 API。如果搜索服务慢或失败，我们希望将其与 LLM 调用隔离。我们可以为这些特定节点添加重试策略而不影响其他节点。
中间可见性： 将 分类意图 作为自己的节点让我们可以在采取行动之前检查 LLM 的决策。这对调试和监控很有价值——你可以准确看到智能体何时以及为什么路由到人工审核。
不同的故障模式： LLM 调用、数据库查找和邮件发送有不同的重试策略。单独的节点让你可以独立配置这些。
可重用性和测试： 更小的节点更容易单独测试和在其他工作流中重用。

另一种有效的方法：你可以将 读取邮件 和 分类意图 合并为单个节点。你会失去在分类前检查原始邮件的能力，并且会在该节点中的任何故障时重复两个操作。对于大多数应用，单独节点的可观测性和调试优势值得这种权衡。应用级别的考虑：步骤 2 中的缓存讨论（是否缓存搜索结果）是应用级别的决策，不是 LangGraph 框架的功能。你根据具体需求在节点函数中实现缓存——LangGraph 不规定这一点。性能考虑：更多节点并不意味着更慢的执行。LangGraph 默认在后台写入检查点（异步持久性模式），所以你的图会继续运行而不等待检查点完成。这意味着你以最小的性能影响获得频繁的检查点。你可以根据需要调整此行为——使用 "exit" 模式仅在完成时进行检查点，或使用 "sync" 模式阻止执行直到每个检查点写入完成。

从这里去哪里

这是关于使用 LangGraph 构建智能体的思维方式的介绍。你可以使用以下内容扩展这个基础：

人机协作模式

学习如何在执行前添加工具审批、批量审批和其他模式

子图

为复杂的多步骤操作创建子图

流式输出

添加流式输出以向用户显示实时进度

可观测性

使用 LangSmith 添加可观测性以进行调试和监控

工具集成

集成更多用于网络搜索、数据库查询和 API 调用的工具

重试逻辑

为失败的操作实现带指数退避的重试逻辑

将这些文档连接到 Claude、VSCode 等工具，通过 MCP 获取实时答案。

在 GitHub 上编辑此页面或提交问题。

Documentation Index

​从你要自动化的流程开始

​步骤 1：将工作流映射为离散步骤

​步骤 2：确定每个步骤需要做什么

LLM 步骤

数据步骤

操作步骤

用户输入步骤

​LLM 步骤

​数据步骤

​操作步骤

​用户输入步骤

​步骤 3：设计你的状态

​什么应该放在状态中？

包含在状态中

不存储

​保持状态原始，按需格式化提示词

​步骤 4：构建你的节点

​适当处理错误

​实现我们的邮件智能体节点

​步骤 5：将它们连接在一起

​试用你的智能体

​总结和后续步骤

​关键洞察

拆分为离散步骤

状态是共享记忆

节点是函数

错误是流程的一部分

人工输入是一等公民

图结构自然涌现

​高级考虑

​从这里去哪里

人机协作模式

子图

流式输出

可观测性

工具集成

重试逻辑

从你要自动化的流程开始

步骤 1：将工作流映射为离散步骤

步骤 2：确定每个步骤需要做什么

LLM 步骤

数据步骤

操作步骤

用户输入步骤

步骤 3：设计你的状态

什么应该放在状态中？

保持状态原始，按需格式化提示词

步骤 4：构建你的节点

适当处理错误

实现我们的邮件智能体节点

步骤 5：将它们连接在一起

试用你的智能体

总结和后续步骤

关键洞察

高级考虑

从这里去哪里