使用返回的任务 ID 进行查询 获取最终结果。
Documentation Index
Fetch the complete documentation index at: https://docs.foxapi.cc/llms.txt
Use this file to discover all available pages before exploring further.
所有接口均需要使用 Bearer Token 进行认证。在请求头中添加:
Authorization: Bearer YOUR_API_KEY
YOUR_API_KEY 为 API Token(sk-... 格式)。
模型名,常用值:
claude-opus-4-7gemini-2.5-pronemotron-3-nano-omnigpt-5.4 / gpt-5.5 / kimi-k2.6 / gemini-3-pro-preview 等"claude-opus-4-7"
"gemini-2.5-pro"
"nemotron-3-nano-omni"
用户提示词,最多 100,000 字符。
100000"Summarize the theory of relativity in two sentences."
同步模式。true 时端点阻塞直到上游完成并返回完整响应(如同时 stream=true,则返回 SSE 流);false 时端点立即返回任务 ID,结果通过 GET /v1/tasks/{task_id} 或 SSE 端点获取。
false
是否流式。true 时 Submit 响应包含 stream.url 指向 SSE 订阅路径;流式 chunks 统一为 OpenAI chat.completion.chunk 格式。
false
生成 token 上限。可选。
x >= 164
采样温度,区间 [0, 2]。可选。
0 <= x <= 20.3
系统指令,前置到对话上下文。可选,最多 10,000 字符。
10000"You are a terse assistant."
是否包含 reasoning tokens。透传到上游;具体语义取决于上游模型(gemini-2.5-pro 等思考模型可能要求 true)。
任务已创建(async 模式)/ 完整响应(sync 模式)
Submit 响应,对齐统一任务标准形状。results / error 在 submit 阶段固定为 null,任务完成/失败后通过 GET /v1/tasks/{task_id} 返回。sync=true, stream=false 模式下端点直接返回完整 OpenAI ChatCompletion JSON(不走本结构)。
任务 ID,格式 task-llmrouter-{timestamp}-{8random}。
"task-llmrouter-1776874565-yq3szvcu"
llm.generation.task "llm.generation.task"
llm "llm"
客户端提交的模型名(原样回显)
"claude-opus-4-7"
pending "pending"
0
1776874565
stream=true 时返回 {url: ...};stream=false 时为 null。
submit 阶段固定 null;任务完成后通过 GET /v1/tasks/{task_id} 返回,results[0] 为完整 OpenAI ChatCompletion 响应。
null
submit 阶段固定 null;任务失败时通过 GET /v1/tasks/{task_id} 返回。
null