Chat Completions
为给定对话创建模型响应。接收消息列表并返回模型的下一条回复。可用于聊天界面、AI 助手、内容生成和各类文本工作流。
本页说明 OpenAI 兼容的 Chat Completions 端点。请使用 openai Python 包或任意 OpenAI 兼容 SDK,并设置 OPENAI_BASE_URL=https://api.linkharbor.ai/v1。Anthropic Messages API 请使用 /anthropic/v1/messages。
请求体
要使用的模型 ID。可通过 GET /v1/models 获取可用模型,并将 your-model-name 替换为实时模型目录中的真实 ID。
组成对话的消息列表。模型会根据这段历史生成下一条回复。
消息作者角色。可选值:system(设置助手行为)、user(用户输入)或 assistant(先前模型回复)。
消息的文本内容。
如果为 true,响应会以 Server-Sent Events (SSE) 流式返回,而不是单个 JSON 对象。每个 chunk 都包含增量内容 delta,流以 data: [DONE] 结束。
采样温度。较高值(如 0.9)会产生更有创意、更多样的输出;较低值(如 0.2)会让响应更聚焦、更确定。建议只调整 temperature 或 top_p 其中之一。
生成的最大 token 数。输入 token 与该值之和不能超过模型上下文窗口。不传则使用模型默认最大值。
响应
返回 chat completion 对象。成功时 HTTP 状态码为 200;出错时返回包含错误类型和消息的 JSON 对象。
本次 completion 的唯一标识符,以 chatcmpl- 开头。
生成本次 completion 的模型。
生成结果数组。每项都包含带 role 和 content 的 message,以及 finish_reason(例如 stop 表示自然结束,length 表示达到 max_tokens)。
本次请求的 token 用量统计。
输入消息中的 token 数。
生成响应中的 token 数。
总 token 数(prompt + completion)。