Doc2X V3 PDF 转换
文档处理
Doc2X V3 PDF 转换
- Doc2X V3 PDF 文档转换模型,将 PDF 转换为 Markdown / LaTeX / DOCX 格式
- 支持公式识别与跨页表格合并
- 结果为 ZIP 压缩包(含转换文档与图片资源),通过
results[0].url下载 - 异步处理模式,使用返回的任务ID 进行查询
- 结果格式为
{url},URL 指向一个可下载的 ZIP 压缩包,内含转换后的文档文件(md / tex / docx)及图片资源,详见 任务查询特殊格式说明 - ZIP 链接有效期为24小时,请尽快下载保存
POST
Doc2X V3 PDF 转换
授权
所有接口均需要使用Bearer Token进行认证
使用时在请求头中添加:
Authorization: Bearer YOUR_API_KEY
请求体
application/json
doc2x-v3:PDF → md / tex / docx 转换,结果为可下载的 ZIP 压缩包
示例:
"doc2x-v3"
PDF 文件下载地址
示例:
"https://example.com/document.pdf"
PDF 页数,用于预扣费与执行时校验
必填范围:
x >= 1示例:
10
输出格式
可用选项:
md, tex, docx 示例:
"md"
公式处理模式
可用选项:
normal, dollar 示例:
"normal"
输出文件名(不含扩展名,超 50 字执行时截断)
Maximum string length:
200示例:
"output"
是否合并跨页表格
示例:
false
响应
任务创建成功
任务创建时间戳
示例:
1757165031
任务ID
示例:
"task-unified-1757165031-uyujaw3d"
实际使用的模型名称
任务的具体类型
可用选项:
document.generation.task 任务进度百分比 (0-100)
必填范围:
0 <= x <= 100示例:
0
任务状态
可用选项:
pending, processing, completed, failed 示例:
"pending"
异步任务信息
任务的输出类型
可用选项:
document 示例:
"document"