回声笔AI文档内容提取API - Word文档结构化提取
回声笔AI文档内容提取API,支持doc/docx格式Word文档上传,自动提取标题、段落、表格等结构化内容,返回JSON格式数据。
文档内容提取接口
规划中
功能概述
上传Word文档(doc/docx),自动提取文档中的结构化内容,以JSON格式返回,方便开发者进行后续处理。
支持格式
| 格式 | 扩展名 | 说明 |
|---|---|---|
| Word文档 | .doc | 旧版Word格式 |
| Word文档 | .docx | 新版Word格式 |
提取内容
{
"title": "文档标题",
"paragraphs": [
{
"type": "heading",
"level": 1,
"text": "第一章 绪论"
},
{
"type": "paragraph",
"text": "正文内容..."
},
{
"type": "table",
"headers": ["列1", "列2"],
"rows": [["数据1", "数据2"]]
}
]
}
接口预览
POST https://api.llmapi.fit/completion/extract
Content-Type: multipart/form-data
Authorization: Bearer YOUR_API_KEY
请求参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
file | file | 是 | Word文档文件(.doc或.docx) |
响应示例
{
"code": "success",
"data": {
"title": "论文标题",
"paragraphs": [
{
"type": "heading",
"level": 1,
"text": "摘要"
},
{
"type": "paragraph",
"text": "本文研究了..."
}
]
}
}
使用场景
- 论文处理 - 提取论文结构,配合降重接口使用
- 文档分析 - 获取文档大纲和关键内容
- 内容迁移 - 将Word文档转换为结构化数据
预计上线时间
待定
预约通知
如果您对此功能感兴趣,可以联系工作人员预约:
- 📧 微信:GDDMDD