回声笔AI文档内容提取API - Word文档结构化提取

回声笔AI文档内容提取API,支持doc/docx格式Word文档上传,自动提取标题、段落、表格等结构化内容,返回JSON格式数据。

文档内容提取接口

规划中

功能概述

上传Word文档(doc/docx),自动提取文档中的结构化内容,以JSON格式返回,方便开发者进行后续处理。

支持格式

格式扩展名说明
Word文档.doc旧版Word格式
Word文档.docx新版Word格式

提取内容

{
  "title": "文档标题",
  "paragraphs": [
    {
      "type": "heading",
      "level": 1,
      "text": "第一章 绪论"
    },
    {
      "type": "paragraph",
      "text": "正文内容..."
    },
    {
      "type": "table",
      "headers": ["列1", "列2"],
      "rows": [["数据1", "数据2"]]
    }
  ]
}

接口预览

POST https://api.llmapi.fit/completion/extract
Content-Type: multipart/form-data
Authorization: Bearer YOUR_API_KEY

请求参数

参数名类型必填说明
filefileWord文档文件(.doc或.docx)

响应示例

{
  "code": "success",
  "data": {
    "title": "论文标题",
    "paragraphs": [
      {
        "type": "heading",
        "level": 1,
        "text": "摘要"
      },
      {
        "type": "paragraph",
        "text": "本文研究了..."
      }
    ]
  }
}

使用场景

  1. 论文处理 - 提取论文结构,配合降重接口使用
  2. 文档分析 - 获取文档大纲和关键内容
  3. 内容迁移 - 将Word文档转换为结构化数据

预计上线时间

待定

预约通知

如果您对此功能感兴趣,可以联系工作人员预约:

  • 📧 微信:GDDMDD