跳转到主要内容
POST
/
v1
/
llm
/
generations
curl --request POST \
  --url https://api.foxapi.cc/v1/llm/generations \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "claude-opus-4-7",
  "prompt": "Summarize the theory of relativity in two sentences.",
  "max_tokens": 64,
  "temperature": 0.3
}
'
{
  "id": "task-llmrouter-1776874481-rj6bs3yb",
  "object": "llm.generation.task",
  "type": "llm",
  "model": "claude-opus-4-7",
  "status": "pending",
  "progress": 0,
  "created": 1776874481,
  "stream": null,
  "results": null,
  "error": null
}

Documentation Index

Fetch the complete documentation index at: https://docs.foxapi.cc/llms.txt

Use this file to discover all available pages before exploring further.

授权

Authorization
string
header
必填

所有接口均需要使用 Bearer Token 进行认证。在请求头中添加:

Authorization: Bearer YOUR_API_KEY

YOUR_API_KEY 为 API Token(sk-... 格式)。

请求体

application/json
model
string
默认值:claude-opus-4-7
必填

模型名,常用值:

  • claude-opus-4-7
  • gemini-2.5-pro
  • nemotron-3-nano-omni
  • gpt-5.4 / gpt-5.5 / kimi-k2.6 / gemini-3-pro-preview
示例:

"claude-opus-4-7"

"gemini-2.5-pro"

"nemotron-3-nano-omni"

prompt
string
必填

用户提示词,最多 100,000 字符。

Maximum string length: 100000
示例:

"Summarize the theory of relativity in two sentences."

sync
boolean
默认值:false

同步模式。true 时端点阻塞直到上游完成并返回完整响应(如同时 stream=true,则返回 SSE 流);false 时端点立即返回任务 ID,结果通过 GET /v1/tasks/{task_id} 或 SSE 端点获取。

示例:

false

stream
boolean
默认值:false

是否流式。true 时 Submit 响应包含 stream.url 指向 SSE 订阅路径;流式 chunks 统一为 OpenAI chat.completion.chunk 格式。

示例:

false

max_tokens
integer | null

生成 token 上限。可选。

必填范围: x >= 1
示例:

64

temperature
number | null

采样温度,区间 [0, 2]。可选。

必填范围: 0 <= x <= 2
示例:

0.3

system_prompt
string | null

系统指令,前置到对话上下文。可选,最多 10,000 字符。

Maximum string length: 10000
示例:

"You are a terse assistant."

reasoning
boolean | null

是否包含 reasoning tokens。透传到上游;具体语义取决于上游模型(gemini-2.5-pro 等思考模型可能要求 true)。

响应

任务已创建(async 模式)/ 完整响应(sync 模式)

Submit 响应,对齐统一任务标准形状。results / error 在 submit 阶段固定为 null,任务完成/失败后通过 GET /v1/tasks/{task_id} 返回。sync=true, stream=false 模式下端点直接返回完整 OpenAI ChatCompletion JSON(不走本结构)。

id
string
必填

任务 ID,格式 task-llmrouter-{timestamp}-{8random}

示例:

"task-llmrouter-1776874565-yq3szvcu"

object
enum<string>
必填
可用选项:
llm.generation.task
示例:

"llm.generation.task"

type
enum<string>
必填
可用选项:
llm
示例:

"llm"

model
string
必填

客户端提交的模型名(原样回显)

示例:

"claude-opus-4-7"

status
enum<string>
必填
可用选项:
pending
示例:

"pending"

progress
integer
必填
示例:

0

created
integer
必填
示例:

1776874565

stream
object

stream=true 时返回 {url: ...}stream=false 时为 null

results
object[] | null

submit 阶段固定 null;任务完成后通过 GET /v1/tasks/{task_id} 返回,results[0] 为完整 OpenAI ChatCompletion 响应。

示例:

null

error
object

submit 阶段固定 null;任务失败时通过 GET /v1/tasks/{task_id} 返回。

示例:

null