流式响应
实时流式传输对话补全。使用服务器推送事件(SSE)接收模型返回的补全分块。
对话补全分块对象
表示根据提供的输入,模型返回的对话补全响应流的一部分。
choices
数组
一个对话补全选项列表。如果设置了 stream_options: {"include_usage": true}
,则最后一个分块可以为空。
显示属性
delta
对象
由流式模型响应生成的对话补全增量。
显示属性
content 字符串或空
分块消息的内容。
refusal 字符串或空
模型生成的拒绝消息。
role 字符串
该消息作者的角色。
tool_calls 数组
模型生成的工具调用。
显示属性
index 整数
工具调用列表中的索引。
function 对象
要调用的函数信息。
显示属性
arguments 字符串
模型以 JSON 格式生成的函数调用参数。请注意,模型生成的 JSON 可能无效,且可能生成未在函数模式中定义的参数。请在调用函数前自行验证参数。
name 字符串
要调用的函数名称。
id 字符串
工具调用的 ID。
type 字符串
工具类型,目前仅支持 function
。
finish_reason
对象
模型停止生成标记的原因。如果到达自然停止点或提供的停止序列,则为 stop
;如果达到请求指定的最大令牌数,则为 length
;如果由于内容过滤器而省略内容,则为 content_filter
;如果模型调用了工具,则为 tool_calls
。
index
整数
选项列表中的索引。
created
整数
对话补全创建的 Unix 时间戳(秒)。每个分块有相同的时间戳。
id
字符串
对话补全的唯一标识符。每个分块具有相同的 ID。
model
字符串
生成补全的模型。
object
字符串
对象类型,始终为 chat.completion.chunk
。
system_fingerprint
字符串
表示模型运行时后端配置的指纹。可以配合 seed
请求参数使用,以了解后端变更对确定性的影响。
usage
对象
补全请求的使用统计。
显示属性
completion_tokens 整数
生成补全使用的令牌数。
prompt_tokens 整数
提示词使用的令牌数。
total_tokens 整数
请求中使用的令牌总数(提示 + 补全)。