跳转至

流式响应

实时流式传输对话补全。使用服务器推送事件(SSE)接收模型返回的补全分块。


对话补全分块对象

表示根据提供的输入,模型返回的对话补全响应流的一部分。

choices 数组
一个对话补全选项列表。如果设置了 stream_options: {"include_usage": true},则最后一个分块可以为空。

显示属性

delta 对象
由流式模型响应生成的对话补全增量。

显示属性

content 字符串或空
分块消息的内容。


refusal 字符串或空
模型生成的拒绝消息。


role 字符串
该消息作者的角色。


tool_calls 数组
模型生成的工具调用。

显示属性

index 整数
工具调用列表中的索引。


function 对象
要调用的函数信息。

显示属性

arguments 字符串
模型以 JSON 格式生成的函数调用参数。请注意,模型生成的 JSON 可能无效,且可能生成未在函数模式中定义的参数。请在调用函数前自行验证参数。


name 字符串
要调用的函数名称。


id 字符串
工具调用的 ID。


type 字符串
工具类型,目前仅支持 function


finish_reason 对象
模型停止生成标记的原因。如果到达自然停止点或提供的停止序列,则为 stop;如果达到请求指定的最大令牌数,则为 length;如果由于内容过滤器而省略内容,则为 content_filter;如果模型调用了工具,则为 tool_calls


index 整数
选项列表中的索引。


created 整数
对话补全创建的 Unix 时间戳(秒)。每个分块有相同的时间戳。


id 字符串
对话补全的唯一标识符。每个分块具有相同的 ID。


model 字符串
生成补全的模型。


object 字符串
对象类型,始终为 chat.completion.chunk


system_fingerprint 字符串
表示模型运行时后端配置的指纹。可以配合 seed 请求参数使用,以了解后端变更对确定性的影响。


usage 对象
补全请求的使用统计。

显示属性

completion_tokens 整数
生成补全使用的令牌数。


prompt_tokens 整数
提示词使用的令牌数。


total_tokens 整数
请求中使用的令牌总数(提示 + 补全)。