LangGraph 内置了持久化层,将图状态保存为检查点。当你使用检查点器编译图时,图状态的快照会在每个执行步骤保存,并按线程组织。这启用了人机协作工作流、会话记忆、时间旅行调试和容错执行。Documentation Index
Fetch the complete documentation index at: https://nvd-54.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.

Agent Server 自动处理检查点
使用 Agent Server 时,你不需要手动实现或配置检查点器。服务器在后台自动处理所有持久化基础设施。
为什么使用持久化
以下功能需要持久化:- 人机协作:检查点器支持人机协作工作流,允许人类检查、中断和批准图步骤。检查点器对这些工作流是必需的,因为人员需要能够在任何时间点查看图状态,并且图需要在人员更新状态后恢复执行。参见中断获取示例。
- 记忆:检查点器允许交互间的”记忆”。在重复人类交互(如对话)的情况下,任何后续消息都可以发送到该线程,该线程将保留之前的记忆。参见添加记忆了解如何使用检查点器添加和管理会话记忆。
- 时间旅行:检查点器允许”时间旅行”,允许用户重放之前的图执行以审查和/或调试特定图步骤。此外,检查点器使得在任意检查点分叉图状态以探索替代轨迹成为可能。
- 容错:检查点提供容错和错误恢复:如果一个或多个节点在给定超级步骤失败,你可以从最后一个成功步骤重启图。
- 待处理写入:当图节点在给定超级步骤中执行失败时,LangGraph 存储该超级步骤中成功完成的其他节点的待处理检查点写入。当你从该超级步骤恢复图执行时,不需要重新运行成功的节点。
核心概念
线程
线程是分配给检查点器保存的每个检查点的唯一 ID 或线程标识符。它包含一系列运行的累积状态。当运行执行时,助手底层图的状态将持久化到线程中。 使用检查点器调用图时,你必须在配置的configurable 部分指定 thread_id:
thread_id 作为存储和检索检查点的主键。没有它,检查点器无法保存状态或在中断后恢复执行,因为检查点器使用 thread_id 加载保存的状态。
检查点
线程在特定时间点的状态称为检查点。检查点是在每个超级步骤保存的图状态快照,由StateSnapshot 对象表示(完整字段参考见 StateSnapshot 字段)。
超级步骤
LangGraph 在每个超级步骤边界创建检查点。超级步骤是图的一个”滴答”,其中该步骤计划的所有节点执行(可能并行)。对于像START -> A -> B -> END 这样的顺序图,输入、节点 A 和节点 B 有各自独立的超级步骤——每个之后都会产生一个检查点。理解超级步骤边界对时间旅行很重要,因为你只能从检查点(即超级步骤边界)恢复执行。
除了超级步骤检查点外,LangGraph 还在节点(任务)级别持久化写入。当超级步骤内的每个节点完成时,其输出作为与进行中检查点关联的任务条目写入检查点器的 checkpoint_writes 表。这些按任务的写入支持待处理写入恢复:如果同一超级步骤中的另一个节点失败,成功节点的写入已经是持久的,恢复时不需要重新运行。完整的状态快照在超级步骤完成后提交。
LangGraph 还持久化超级步骤内各个节点执行的写入。这些写入作为任务存储,用于容错:如果同一超级步骤中的另一个节点失败,成功节点的写入不需要重新计算。这些任务写入不是完整的 StateSnapshot 检查点,因此时间旅行从超级步骤边界的完整检查点恢复。
检查点被持久化,可用于在以后恢复线程状态。
让我们看看当一个简单图被如下调用时保存了哪些检查点:
- 空检查点,以
START作为下一个要执行的节点 - 包含用户输入
{'foo': '', 'bar': []}且node_a为下一个要执行节点的检查点 - 包含
node_a输出{'foo': 'a', 'bar': ['a']}且node_b为下一个要执行节点的检查点 - 包含
node_b输出{'foo': 'b', 'bar': ['a', 'b']}且没有下一个要执行节点的检查点
bar 通道值包含两个节点的输出,因为我们为 bar 通道设置了 reducer。
检查点命名空间
每个检查点有一个checkpoint_ns(检查点命名空间)字段,标识它属于哪个图或子图:
""(空字符串):检查点属于父(根)图。"node_name:uuid":检查点属于作为给定节点调用的子图。对于嵌套子图,命名空间用|分隔符连接(例如"outer_node:uuid|inner_node:uuid")。
获取和更新状态
获取状态
与保存的图状态交互时,你必须指定线程标识符。你可以通过调用graph.get_state(config) 查看图的_最新_状态。这将返回一个对应于配置中提供的线程 ID 或该线程特定检查点 ID(如果提供的话)关联的最新检查点的 StateSnapshot 对象。
get_state 的输出如下所示:
StateSnapshot 字段
| 字段 | 类型 | 描述 |
|---|---|---|
values | dict | 此检查点的状态通道值。 |
next | tuple[str, ...] | 接下来要执行的节点名称。空 () 表示图已完成。 |
config | dict | 包含 thread_id、checkpoint_ns 和 checkpoint_id。 |
metadata | dict | 执行元数据。包含 source("input"、"loop" 或 "update")、writes(节点输出)和 step(超级步骤计数器)。 |
created_at | str | 此检查点创建的 ISO 8601 时间戳。 |
parent_config | dict | None | 前一个检查点的配置。第一个检查点为 None。 |
tasks | tuple[PregelTask, ...] | 此步骤要执行的任务。每个任务有 id、name、error、interrupts,以及可选的 state(使用 subgraphs=True 时的子图快照)。 |
获取状态历史
你可以通过调用graph.get_state_history(config) 获取给定线程的完整图执行历史。这将返回与配置中提供的线程 ID 关联的 StateSnapshot 对象列表。重要的是,检查点将按时间倒序排列,最新的检查点/StateSnapshot 在列表的第一个。
get_state_history 的输出如下所示:

查找特定检查点
你可以过滤状态历史以查找匹配特定条件的检查点:重放
重放从先前的检查点重新执行步骤。使用先前的checkpoint_id 调用图以重新运行该检查点之后的节点。检查点之前的节点被跳过(其结果已保存)。检查点之后的节点重新执行,包括任何 LLM 调用、API 请求或中断——这些在重放期间总是会被重新触发。
参见时间旅行获取关于重放过去执行的完整详情和代码示例。

更新状态
你可以使用update_state 编辑图状态。这会创建一个具有更新值的新检查点——它不会修改原始检查点。更新与节点更新的处理方式相同:值通过 reducer 函数传递(当定义了时),因此带有 reducer 的通道会_累积_值而非覆盖。
你可以选择性地指定 as_node 来控制更新被视为来自哪个节点,这会影响下一个执行的节点。详见时间旅行:as_node。

记忆存储

Store 接口的需求。作为示例,我们可以定义一个 InMemoryStore 来跨线程存储用户信息。我们只需像之前一样使用检查点器编译图,并传入 store。
LangGraph API 自动处理存储
使用 LangGraph API 时,你不需要手动实现或配置存储。API 在后台自动处理所有存储基础设施。
InMemoryStore 适用于开发和测试。生产环境中,使用持久化存储如
PostgresStore、MongoDBStore 或 RedisStore。所有实现都扩展了 BaseStore,这是在节点函数签名中使用的类型注解。基本用法
首先,让我们在不使用 LangGraph 的情况下单独展示。tuple 进行命名空间划分,在此示例中为 (<user_id>, "memories")。命名空间可以是任意长度,代表任何内容,不必是用户特定的。
store.put 方法将记忆保存到存储中的命名空间。执行此操作时,我们指定如上定义的命名空间,以及记忆的键值对:键只是记忆的唯一标识符(memory_id),值(一个字典)是记忆本身。
store.search 方法读取命名空间中的记忆,该方法将返回给定用户的记忆列表,最多到 limit 参数(默认 10)。使用 InMemoryStore 时,项目按插入顺序返回,最近的记忆在列表最后;其他后端可能排序不同(参见列出命名空间中的项目)。
Item),具有特定属性。我们可以通过如上 .dict 将其转换为字典来访问。
它具有的属性:
-
value:此记忆的值(本身是一个字典) -
key:此命名空间中此记忆的唯一键 -
namespace:字符串元组,此记忆类型的命名空间虽然类型是tuple[str, ...],但转换为 JSON 时可能被序列化为列表(例如['1', 'memories'])。 -
created_at:此记忆创建的时间戳 -
updated_at:此记忆更新的时间戳
列出命名空间中的项目
调用store.search(或异步 store.asearch)时不带 query 和 filter,将返回 namespace_prefix 下存储的项目,最多到 limit。当你不需要语义排序时,使用此方法枚举命名空间中的所有内容。
namespace_prefix按前缀匹配,不是精确匹配。("alice",)也会返回("alice", "memories")、("alice", "preferences")等下的项目。要限制到单一层级,传递完整命名空间或在客户端按item.namespace过滤返回的项目。- 超过
limit的结果会被静默截断。 没有溢出信号——将limit设置为高于预期最大值,或使用offset分页。 - 默认排序取决于存储后端。
PostgresStore和AsyncPostgresStore按updated_at降序返回结果(最近更新的在前)。InMemoryStore按插入顺序返回结果(最近插入的在后)。不要依赖跨实现的特定顺序——如果顺序重要,在客户端按item.updated_at排序。
store.list_namespaces 或 store.alist_namespaces:
语义搜索
除了简单检索外,存储还支持语义搜索,允许你基于含义而非精确匹配查找记忆。要启用此功能,使用嵌入模型配置存储:fields 参数或在存储记忆时指定 index 参数来控制记忆的哪些部分被嵌入:
在 LangGraph 中使用
有了这些准备,我们在 LangGraph 中使用存储。存储与检查点器配合使用:如上所述,检查点器将状态保存到线程,而存储允许我们存储任意信息以_跨_线程访问。我们如下使用检查点器和存储编译图。thread_id 调用图,还使用 user_id,我们将用它来命名空间化该特定用户的记忆,如上所示。
Runtime 对象访问存储和 user_id。当你将 Runtime 作为参数添加到节点函数时,LangGraph 会自动注入它。以下是你可能用它保存记忆的方式:
store.search 方法获取记忆。回忆记忆作为可转换为字典的对象列表返回。
user_id 相同,仍然可以访问相同的记忆。
langgraph.json 文件中配置索引设置。例如:
优化检查点存储
默认情况下,LangGraph 检查点在每个超级步骤写入每个状态通道的完整值。对于具有大量累积的长时间运行线程(如多轮对话),这可能随时间产生显著的存储增长。DeltaChannel 只存储增量差异而非完整累积值,大大减少了追加密集型通道的检查点大小。参见 DeltaChannel 了解用法和存储与延迟的权衡。
检查点器库
底层检查点由符合BaseCheckpointSaver 接口的检查点器对象驱动。LangGraph 提供了多个检查点器实现,都通过独立的、可安装的库实现。
参见检查点器集成了解可用的提供者。
langgraph-checkpoint:检查点保存器的基础接口(BaseCheckpointSaver)和序列化/反序列化接口(SerializerProtocol)。包含内存检查点器实现(InMemorySaver)用于实验。LangGraph 自带langgraph-checkpoint。langgraph-checkpoint-sqlite:使用 SQLite 数据库的 LangGraph 检查点器实现(SqliteSaver/AsyncSqliteSaver)。适合实验和本地工作流。需要单独安装。langgraph-checkpoint-postgres:使用 Postgres 数据库的高级检查点器(PostgresSaver/AsyncPostgresSaver),在 LangSmith 中使用。适合生产环境使用。需要单独安装。langchain-azure-cosmosdb:使用 Azure Cosmos DB for NoSQL 的 LangGraph 检查点器实现(CosmosDBSaverSync/CosmosDBSaver)。适合在 Azure 上的生产环境使用。支持同步和异步操作,带有 Microsoft Entra ID 认证。需要单独安装。
检查点器接口
每个检查点器符合BaseCheckpointSaver 接口并实现以下方法:
.put- 存储检查点及其配置和元数据。.put_writes- 存储与检查点关联的中间写入(即待处理写入)。.get_tuple- 使用给定配置(thread_id和checkpoint_id)获取检查点元组。用于在graph.get_state()中填充StateSnapshot。.list- 列出匹配给定配置和过滤条件的检查点。用于在graph.get_state_history()中填充状态历史。
.ainvoke、.astream、.abatch 执行图),将使用上述方法的异步版本(.aput、.aput_writes、.aget_tuple、.alist)。
对于异步运行图,你可以使用
InMemorySaver,或 Sqlite/Postgres 检查点器的异步版本——AsyncSqliteSaver / AsyncPostgresSaver 检查点器。序列化器
当检查点器保存图状态时,它们需要序列化状态中的通道值。这通过序列化器对象完成。langgraph_checkpoint 定义了实现序列化器的协议并提供了默认实现(JsonPlusSerializer),处理各种类型,包括 LangChain 和 LangGraph 原语、日期时间、枚举等。
使用 pickle 序列化
默认序列化器 JsonPlusSerializer 底层使用 ormsgpack 和 JSON,不适用于所有类型的对象。
如果你想对当前 msgpack 编码器不支持的对象(如 Pandas 数据帧)回退到 pickle,你可以使用 JsonPlusSerializer 的 pickle_fallback 参数:
加密
检查点器可以选择性地加密所有持久化状态。要启用此功能,将EncryptedSerializer 实例传递给任何 BaseCheckpointSaver 实现的 serde 参数。创建加密序列化器的最简单方式是通过 from_pycryptodome_aes,它从 LANGGRAPH_AES_KEY 环境变量读取 AES 密钥(或接受 key 参数):
LANGGRAPH_AES_KEY,加密会自动启用,因此你只需要提供环境变量。其他加密方案可以通过实现 CipherProtocol 并将其提供给 EncryptedSerializer 来使用。
连接这些文档到 Claude、VSCode 等工具,通过 MCP 获取实时回答。

