Documentation Index Fetch the complete documentation index at: https://nvd-54.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
LangChain 实现了一个流式系统来展示实时更新。
流式输出对于增强基于 LLM 构建的应用的响应性至关重要。通过逐步显示输出,即使在完整响应准备好之前,流式输出也能显著改善用户体验(UX),特别是在处理 LLM 的延迟时。
LangChain 的流式系统让你可以将智能体运行的实时反馈展示到你的应用中。
LangChain 流式输出的功能:
请参阅下面的常见模式 部分获取更多端到端示例。
支持的流式模式
将以下一种或多种流式模式作为列表传递给 stream 方法:
模式 描述 updates在每个智能体步骤后流式传输状态更新。如果在同一步骤中进行了多个更新(例如运行了多个节点),这些更新将分别流式传输。 messages从调用 LLM 的任何图节点流式传输 (token, metadata) 元组。 custom使用流式写入器从图节点内部流式传输自定义数据。
智能体进度
要流式传输智能体进度,使用 stream 方法并设置 streamMode: "updates"。这会在每个智能体步骤后发出事件。
例如,如果你有一个调用一次工具的智能体,你应该看到以下更新:
import z from "zod" ;
import { createAgent , tool } from "langchain" ;
const getWeather = tool (
async ({ city }) => {
return `The weather in ${ city } is always sunny!` ;
},
{
name : "get_weather" ,
description : "Get weather for a given city." ,
schema : z . object ( {
city : z . string () ,
} ) ,
}
) ;
const agent = createAgent ( {
model : "gpt-5-nano" ,
tools : [getWeather] ,
} ) ;
for await ( const chunk of await agent . stream (
{ messages : [ { role : "user" , content : "旧金山的天气怎么样" } ] },
{ streamMode : "updates" }
)) {
const [ step , content ] = Object . entries (chunk)[ 0 ] ;
console . log ( `步骤: ${ step } ` ) ;
console . log ( `内容: ${ JSON . stringify ( content , null , 2 ) } ` ) ;
}
LLM Token
要在 LLM 生成 Token 时进行流式传输,使用 streamMode: "messages":
import z from "zod" ;
import { createAgent , tool } from "langchain" ;
const getWeather = tool (
async ({ city }) => {
return `The weather in ${ city } is always sunny!` ;
},
{
name : "get_weather" ,
description : "Get weather for a given city." ,
schema : z . object ( {
city : z . string () ,
} ) ,
}
) ;
const agent = createAgent ( {
model : "gpt-5.4-mini" ,
tools : [getWeather] ,
} ) ;
for await ( const [ token , metadata ] of await agent . stream (
{ messages : [ { role : "user" , content : "旧金山的天气怎么样" } ] },
{ streamMode : "messages" }
)) {
console . log ( `节点: ${ metadata . langgraph_node } ` ) ;
console . log ( `内容: ${ JSON . stringify ( token . contentBlocks , null , 2 ) } ` ) ;
}
自定义更新
要在工具执行时流式传输更新,你可以使用配置中的 writer 参数。
import z from "zod" ;
import { tool , createAgent } from "langchain" ;
import { LangGraphRunnableConfig } from "@langchain/langgraph" ;
const getWeather = tool (
async ( input , config : LangGraphRunnableConfig ) => {
// 流式传输任意数据
config . writer ?. ( `正在查找城市数据: ${ input . city } ` ) ;
// ... 获取城市数据
config . writer ?. ( `已获取城市数据: ${ input . city } ` ) ;
return `It's always sunny in ${ input . city } !` ;
},
{
name : "get_weather" ,
description : "Get weather for a given city." ,
schema : z . object ( {
city : z . string () . describe ( "The city to get weather for." ) ,
} ) ,
}
) ;
const agent = createAgent ( {
model : "gpt-5.4-mini" ,
tools : [getWeather] ,
} ) ;
for await ( const chunk of await agent . stream (
{ messages : [ { role : "user" , content : "旧金山的天气怎么样" } ] },
{ streamMode : "custom" }
)) {
console . log (chunk) ;
}
正在查找城市数据: San Francisco
已获取城市数据: San Francisco
如果你向工具添加了 writer 参数,在没有提供 writer 函数的情况下,你将无法在 LangGraph 执行上下文之外调用该工具。
流式多模式
你可以通过将 streamMode 作为数组传递来指定多种流式模式:streamMode: ["updates", "messages", "custom"]。
流式输出将是 [mode, chunk] 的元组,其中 mode 是流式模式的名称,chunk 是该模式流式传输的数据。
import z from "zod" ;
import { tool , createAgent } from "langchain" ;
import { LangGraphRunnableConfig } from "@langchain/langgraph" ;
const getWeather = tool (
async ( input , config : LangGraphRunnableConfig ) => {
// 流式传输任意数据
config . writer ?. ( `正在查找城市数据: ${ input . city } ` ) ;
// ... 获取城市数据
config . writer ?. ( `已获取城市数据: ${ input . city } ` ) ;
return `It's always sunny in ${ input . city } !` ;
},
{
name : "get_weather" ,
description : "Get weather for a given city." ,
schema : z . object ( {
city : z . string () . describe ( "The city to get weather for." ) ,
} ) ,
}
) ;
const agent = createAgent ( {
model : "gpt-5.4-mini" ,
tools : [getWeather] ,
} ) ;
for await ( const [ streamMode , chunk ] of await agent . stream (
{ messages : [ { role : "user" , content : "旧金山的天气怎么样" } ] },
{ streamMode : [ "updates" , "messages" , "custom" ] }
)) {
console . log ( ` ${ streamMode } : ${ JSON . stringify ( chunk , null , 2 ) } ` ) ;
}
常见模式
以下是展示流式输出常见用例的示例。
流式思考/推理 Token
某些模型在生成最终答案之前会执行内部推理。你可以通过过滤标准内容块 中 type 为 "reasoning" 的块来流式传输这些思考/推理 Token。
要从智能体流式传输思考 Token,使用 streamMode: "messages" 并过滤推理内容块。当模型支持时,使用启用了扩展思考的模型实例(例如 ChatAnthropic):
import z from "zod" ;
import { createAgent , tool } from "langchain" ;
import { ChatAnthropic } from "@langchain/anthropic" ;
const getWeather = tool (
async ({ city }) => {
return `It's always sunny in ${ city } !` ;
},
{
name : "get_weather" ,
description : "Get weather for a given city." ,
schema : z . object ( { city : z . string () } ) ,
},
) ;
const agent = createAgent ( {
model : new ChatAnthropic ( {
model : "claude-sonnet-4-6" ,
thinking : { type : "enabled" , budget_tokens : 5000 },
} ) ,
tools : [getWeather] ,
} ) ;
for await ( const [ token , metadata ] of await agent . stream (
{ messages : [ { role : "user" , content : "What is the weather in SF?" } ] },
{ streamMode : "messages" },
)) {
if ( ! token . contentBlocks) continue ;
const reasoning = token . contentBlocks . filter ( ( b ) => b . type === "reasoning" ) ;
const text = token . contentBlocks . filter ( ( b ) => b . type === "text" ) ;
if (reasoning . length) {
process . stdout . write ( `[thinking] ${ reasoning [ 0 ] . reasoning } ` ) ;
}
if (text . length) {
process . stdout . write (text[ 0 ] . text) ;
}
}
[ thinking ] The user is asking about the weather in San Francisco. I have a tool
[ thinking ] available to get this information. Let me call the get_weather tool
[ thinking ] with "San Francisco" as the city parameter.
The weather in San Francisco is: It's always sunny in San Francisco!
无论模型提供商如何,这都以相同方式工作——LangChain 通过 content_blocks 属性将提供商特定的格式(Anthropic thinking 块、OpenAI reasoning 摘要等)规范化为标准的 "reasoning" 内容块类型。
要直接从聊天模型(不使用智能体)流式传输推理 Token,请参阅使用聊天模型流式输出 。
禁用流式输出
在某些应用中,你可能需要为给定模型禁用单个 Token 的流式输出。这在以下情况下很有用:
使用多智能体 系统来控制哪些智能体流式输出其结果
混合支持流式输出的模型和不支持的模型
部署到 LangSmith 并希望防止某些模型输出流式传输到客户端
在初始化模型时设置 streaming: false。
import { ChatOpenAI } from "@langchain/openai" ;
const model = new ChatOpenAI ( {
model : "gpt-5.4" ,
streaming : false ,
} ) ;
部署到 LangSmith 时,在你不希望将输出流式传输到客户端的任何模型上设置 streaming=False。这在部署前在你的图代码中配置。
并非所有聊天模型集成都支持 streaming 参数。如果你的模型不支持,改用 disableStreaming: true。此参数通过基类在所有聊天模型上可用。
请参阅 LangGraph 流式输出指南 了解更多详情。
相关内容
连接这些文档 到 Claude、VSCode 等,通过 MCP 获取实时答案。