功能定位：为什么需要手动设置 QPS 上限

有道翻译 API 默认采用「账户级弹性限流」：当瞬时请求突增时，网关会先放行再回退，高峰后恢复。对大多数低频场景，这种「黑盒」机制足够；但在高并发业务（如跨境电商实时上架、批量文档本地化）中，突刺流量可能触发 429 错误，导致前端重试风暴。手动设定每秒调用频率上限（QPS）可把弹性限流改为「硬顶」，让后端提前拒绝超限请求，避免配额瞬间耗尽，也方便与本地队列做反压配合。

经验性观察：当单账户日调用量 ≥20 万次且峰值集中在 10:00、20:00 两个时段时，开启 QPS 硬顶可将 429 错误率从「偶发」降至「近零」，同时整体延迟分布更集中（P99 缩短约 15%）。

最短可达路径：控制台 3 步完成

以下步骤以「有道智云」网页控制台为准，截至当前的最新版本界面；若后续 UI 调整，请以实际菜单名为准。

登录 ai.youdao.com → 右上角切换至「企业控制台」。
左侧导航 API 管理 → 翻译实例，在目标实例右侧点击配置。
在「流量控制」卡片中，将「每秒调用上限」滑杆拖到期望数值（1–200 可调），点击保存。系统提示「配置已下发」即生效，无需重启密钥。

若需批量修改多实例，可勾选左侧复选框后点击顶部 批量调频，逻辑与单实例一致。

移动端临时查看

控制台暂未提供官方 App；如需手机端查看，可在浏览器开启「桌面版网站」模式，步骤同上。经验性观察：在 5G 网络下保存延迟约 1.2 秒，与 PC 差异可忽略。

生效规则与回退策略

1. 秒级生效：网关会在 1–3 秒内完成配置热加载，已建立的长连接不受影响，但新请求立即按新阈值计数。

2. 回退零成本：若发现业务被误限，可将滑杆调回 0（代表恢复默认弹性），保存后同样秒级生效；官方不收取变更次数费用。

3. 与「日调用总量」并行：QPS 硬顶优先触发。举例：账户日配额 100 万次，QPS 设为 50，则每秒最多通过 50 次，即使当日剩余配额充足也继续限流。

常见分支：找不到「流量控制」卡片

现象：步骤 3 中仅看到「基础信息」「密钥管理」等卡片，无「流量控制」。原因与处置如下：

账户类型为「个人体验版」：该版本默认不开放 QPS 自定义。升级至「企业标准版」后即可见。
实例为「离线 SDK」：离线包在本地运行，不走云端网关，因此无 QPS 概念。需改用在线实例。
浏览器缓存：强制刷新（Ctrl+F5）或无痕窗口重新登录，可排除前端缓存导致菜单缺失。

副作用与取舍：何时不该设得过低

1. 业务突发脉冲：大促零点瞬间 500 QPS，若提前把阈值压到 50，虽然保护了配额，却会让前端批量任务全部收到 429，重试后形成「梯形」延迟。解决：提前评估峰值，用「峰值 ×1.2」作为硬顶，或改用队列削峰。

2. 多租户混用：同一账户下若同时对接了 App 端、小程序、后台脚本，QPS 硬顶为全局共享，任一渠道突增都会挤占其余渠道。解决：为不同渠道申请独立实例，各自设置配额。

经验性观察

当 QPS 硬顶 ≤20 且并发客户端 ≥3 时，容易出现「看似随机」的 429；把阈值提到 50 以上后，冲突概率呈肉眼可见下降。

验证与观测：如何确认已生效

1. 控制台实时图表：保存后 30 秒，刷新「流量控制」卡片，可见「当前 QPS」折线；故意用脚本并发 100 次，若折线顶部被削平到设定值，即生效。

2. 响应头追踪：超限请求返回 HTTP 429，Header 带 X-RateLimit-Limit: 你设的数值；抓包工具可见。

3. 日志对接：若开通了「推送日志到 SLS」功能，可在日志服务的 rate_limit_threshold 字段看到相同数值，方便与内部监控对齐。

与第三方调度器协同示例

场景：技术团队使用 Apache Airflow nightly 批量翻译 30 万条 UI 字符串。做法：

将有道 QPS 硬顶设为 80，留 20% 余量给日间业务。
Airflow 侧用 BashOperator 调用翻译接口，--max-parallel 72，低于阈值防止竞态。
收到 429 时休眠 1 秒再退避，最多 3 次；仍失败则写 /tmp/retry 由次日补跑。

结果：任务总耗时约 70 分钟，全程无人工干预，配额使用率为 98%，未影响在线业务。

故障排查速查表

现象	可能原因	验证动作	处置
429 但 X-RateLimit-Limit 与设定值不符	命中「账户级日总量」上限	查看控制台「今日用量」是否 100%	升级套餐或等待次日重置
控制台保存按钮灰色	权限角色为「只读」	右上角头像 → 权限管理	让主账号授予「运维」角色
生效 10 分钟后又出现 429	多实例共享密钥，其他实例拉高计数	日志里比对 `appKey`	分拆密钥或独立实例

适用 / 不适用场景清单

适用

峰值可预测的营销活动（秒杀文案翻译）
内部 CI 自动本地化，需在凌晨批量跑完
多客户端共享账户，需防止某一方突刺

不适用

离线 SDK 场景（限流由本地自行控制）
需要秒级动态升降 QPS 的弹性伸缩业务（控制台变更虽秒级，但人工操作不够自动）
个人体验版账户（功能入口不可见）

最佳实践 5 条

先压测再设值：用脚本跑阶梯并发，记录首次出现 429 的临界点，取 80% 作为硬顶。
留 20% 余量给重试：避免网络抖动导致正常请求被误杀。
多实例隔离：不同业务线申请不同实例，各自设 QPS，防止「一损俱损」。
监控对齐：把「X-RateLimit-Limit」「X-RateLimit-Remaining」打到 Prometheus，报警阈值 remaining < 10%。
定期回顾：每月检查「峰值 / 均值」比值，若持续 < 2，可适当下调硬顶节省预算。

FAQ（结构化数据）

QPS 设为 0 代表无限流吗？

不是，0 代表恢复官方默认弹性限流，仍受日总量与底层保护阈值约束。

调高 QPS 会额外收费吗？

控制台调整本身免费，但调用量增加可能导致套餐提前用尽，需购买叠加包。

支持按 IP 或用户级细粒度限流吗？

目前仅实例级统一 QPS，如需更细粒度，需在业务层自行拆分实例或做本地漏斗。

总结与下一步行动

设置有道翻译 API 的每秒调用频率上限，本质是把「后端弹性限流」变为「可预期硬顶」，在峰值可控、多客户端共享或 CI 批量场景中尤其有用。核心动作只有「控制台拖动滑杆」一步，真正的难点在于事前压测与事后监控。建议你今天就：

用脚本跑出自己业务的首次 429 临界点；
在控制台把 QPS 设为临界值的 80%，并打开日志推送；
把 X-RateLimit-Remaining 接入内部监控，设置 < 10% 的报警。

完成这三步，你就能在不影响用户体验的前提下，把配额消耗节奏完全握在自己手里。

有道翻译API如何设置每秒调用频率上限？