自定义格式

授权

Authorization

string

header

必填

所有接口均需要使用 Bearer Token 进行认证。在请求头中添加：

Authorization: Bearer YOUR_API_KEY

YOUR_API_KEY 为 API Token（sk-... 格式）。

请求体

application/json

messages[] 形态的请求体（OpenAI Chat 兼容）。除下列字段外，其他 OpenAI 兼容参数（temperature、top_p、stop、frequency_penalty 等）按 OpenAI Chat 规范使用。

model

enum<string>

必填

模型名，严格白名单，未列出的值返回 422 model_not_supported。

特殊行为：

模型	备注
`gpt-5.4`	`max_tokens` 传入时必须 ≥ 16
`gpt-5.5`	`max_tokens` 传入时必须 ≥ 16
`kimi-k2.6`	thinking 模型：SSE 正确透传 `delta.reasoning_content`，但 `GET /v1/tasks/{task_id}` 的 `results[0].message.content` 不累积 `reasoning_content`
`claude-opus-4-6` / `claude-opus-4-7` / `claude-sonnet-4-6`	`max_tokens` 必填
`gemini-3-pro-preview` / `gemini-3.1-pro-preview`	—

可用选项:

gpt-5.4,

gpt-5.5,

kimi-k2.6,

claude-opus-4-6,

claude-opus-4-7,

claude-sonnet-4-6,

gemini-3-pro-preview,

gemini-3.1-pro-preview

示例:

"claude-opus-4-7"

messages

object[]

必填

对话消息数组。messages[*].content 可为 string（纯文本）或 array（多模态块）。多模态块 type ∈ {text, image_url, video_url, audio_url, file_url}；不是所有模型都支持所有类型，不支持时返回 422 unsupported_content_type。

content 类型支持：

模型	text	image_url	video_url	audio_url	file_url
`gpt-5.4` / `gpt-5.5` / `kimi-k2.6`	✓	✓	✗	✗	✗
`claude-*`	✓	✓	✗	✗	✓
`gemini-*`	✓	✓	✓	✓	✓

Show child attributes

示例:

[
  { "role": "user", "content": "count 1 to 3" }
]

stream

boolean

默认值:false

是否流式。

行为差异：

值	Submit 响应 `stream` 字段	SSE 端点
`false`	`null`	不可用
`true`	`{"url": "/v1/llm/generations/{task_id}/stream"}`	可用；同时 task.data 累积完整响应

示例:

false

max_tokens

integer | null

生成 token 上限。模型约束：

gpt-5.4 / gpt-5.5 传入时必须 ≥ 16，否则 422
claude-* 必填，缺失时 422
kimi-k2.6 / gemini-* 可选

示例:

64

temperature

number | null

采样温度。

top_p

number | null

nucleus sampling。

stop

停止序列。

响应

任务已创建

Submit 响应，对齐统一任务标准形状。results / error 在 submit 阶段固定为 null，任务完成/失败后通过 GET /v1/tasks/{task_id} 返回

string

必填

任务 ID，格式 task-llm-{timestamp}-{8random}。用于 GET /v1/tasks/{task_id} 查询或 GET /v1/llm/generations/{task_id}/stream 订阅 SSE

示例:

"task-llm-1776874565-yq3szvcu"

object

enum<string>

必填

对象类型，固定 llm.generation.task

可用选项:

llm.generation.task

示例:

"llm.generation.task"

type

enum<string>

必填

媒体类型，固定 llm

可用选项:

llm

示例:

"llm"

model

string

必填

客户端提交的模型名（原样回显）

示例:

"claude-opus-4-7"

status

enum<string>

必填

任务状态，submit 阶段固定 pending

可用选项:

pending

示例:

"pending"

progress

integer

必填

进度 0-100，submit 阶段固定 0

示例:

0

created

integer

必填

创建时间（Unix 秒）

示例:

1776874565

stream

object

stream=true 时返回 {url: ...}；stream=false 时为 null。客户端据此决定是否连接 SSE

Show child attributes

results

object[] | null

submit 阶段固定 null；任务完成后通过 GET /v1/tasks/{task_id} 返回，results[0] 为完整 OpenAI ChatCompletion 响应。

已知限制：model=kimi-k2.6（thinking 模型）的 reasoning_content 不累积到最终 message.content，因此 results[0].message.content 可能为空字符串

示例:

null

error

object

submit 阶段固定 null；任务失败时通过 GET /v1/tasks/{task_id} 返回

示例:

null

图像系列

视频系列

音频系列

语言系列

任务管理

文件管理

授权

请求体

响应

图像系列

视频系列

音频系列

语言系列

任务管理

文件管理

Documentation Index

授权

请求体

响应