回声笔AI API速率限制 - 论文降重接口调用频率说明
回声笔AI提供论文降重、降AI检测服务,本文档说明降重API的调用频率限制、QPS限制及最佳实践,帮助您合理使用论文改写接口。
回声笔AI API速率限制
本文档说明回声笔AI各接口的速率限制策略及使用建议。
各接口速率限制
论文降重/降AI接口
回声笔AI采用智能队列调度系统,具备以下特点:
- 多卡负载均衡:系统自动将请求分配到负载最低的GPU卡,确保处理效率最优
- 动态队列管理:
- 高峰期请求会自动进入队列等待
- 系统会根据当前负载智能调整处理节奏
- 最长等待时间约2分钟,超时后会返回错误提示
- 建议调用频率:虽然系统具备智能调度能力,但为了您业务的稳定性,在处理批量请求时,建议批次间隔 1-2 秒,且批次内请求速率控制在 10次/秒 以内。
- 最佳实践:
- 在您的项目中实现本地队列管理
- 遇到
503 GPU服务繁忙错误时,建议等待 3-5 秒后重试 - 批量处理时建议分批次提交,每批间隔 1-2 秒
其他接口
| 接口 | 状态 | QPS | QPM | 并发数 |
|---|---|---|---|---|
| AI检测接口 | 内测中 | 待定 | 待定 | 待定 |
| 论文格式调整接口 | 规划中 | 待定 | 待定 | 待定 |
| 文档内容提取接口 | 规划中 | 待定 | 待定 | 待定 |
| PDF OCR接口 | 规划中 | 待定 | 待定 | 待定 |
注意:其他接口的速率限制将在正式上线前公布,请关注文档更新。