功能定位:为什么需要“批量+优先级”

在 NNMT-3.0 引擎下,单个术语条目即可让 BLEU 提升 0.8–1.2 分;当项目词汇过千后,手动逐条维护已不现实。批量导入可把 Excel/CSV 一次写入云端,而“优先级顺序”决定冲突时哪条术语胜出——这在跨境电商 SKU 翻译、药品注册资料多版本并行时尤为关键。

2025Q4 起,有道将“术语库”从单纯的“词典”升级为“项目级资产”,引入 0–9 级优先级(9 最高)与锁定机制;老用户若仍用 2024 及更早客户端,只能看到“是否覆盖”二选一,无法微调顺序,因此升级客户端是前提。

功能定位:为什么需要“批量+优先级”
功能定位:为什么需要“批量+优先级”

版本与入口差异速览

平台最低可用版本入口备注
Windows 桌面10.12.0主界面→术语库→批量管理支持拖拽 CSV
macOS 桌面10.12.2同上M 系列需 Rosetta 关闭才能拖拽
Android9.8.1我的→术语云→⋮→批量导入单次≤2 000 行
iOS9.8.0同上受系统沙盒限制,仅支持“文件”App 选取

准备 CSV:格式与常见坑

模板可在“批量管理”面板右上角“下载示例”获得。核心列:源语言文本、目标语言文本、优先级(0–9)、备注。经验性观察:若优先级列留空,系统默认为 5;若同一源词出现不同优先级,以最高级生效,不提示冲突。

警告:CSV 必需 UTF-8 无 BOM,否则 Android 端会上传成功但解析为乱码,且不会回滚,需要手动删除后重新导入。

最短操作路径(Windows 示例)

  1. 打开有道翻译 10.12 版,登录企业账号(个人账号看不到“批量管理”)。
  2. 侧边栏切换至“术语库”→“批量管理”。
  3. 点击“导入”→拖拽 CSV→勾选“覆盖同优先级”。
  4. 在“优先级策略”弹窗选择“数字大者优先”→“确定”。
  5. 等待解析完成,若行数>5 000,系统会邮件通知,避免界面卡死。

回退方案:导入前系统会自动生成快照,48 小时内可在“历史版本”一键还原;超过 48 小时需手动导出当前库再删除冲突条目。

移动端导入:Android vs iOS

Android 9.8.1 支持“分片上传”,2 000 行文件约 15 秒完成;若超出,系统提示“请用桌面端”。iOS 因沙盒限制,超过 1 000 行极易触发“内存压力被杀后台”,经验性观察:把文件拆成 500 行/份可 100% 成功。

提示:移动端导入后,优先级策略默认“数字大者优先”,与桌面端最后一次设置保持一致;若从未在桌面端设置过,则默认“先导入者优先”。

冲突场景与优先级判决

假设同一条源文“screen”存在两条术语:A 优先级 7→“屏幕”,B 优先级 8→“滤网”。当翻译句子“Touch the screen”时,引擎会选 B“滤网”,显然不符合语境。此时有两种缓解办法:

  • 把 A 的优先级提升到 9,或把 B 降到 6 以下;
  • 在“场景规则”里为“电子产品”类文档单独绑定术语子库,避开通用库中的 B。

工作假设:若同一库内出现完全相同的源文+优先级,系统保留最新时间戳条目,旧条目自动进入“回收站”,不会提示。

与 Trados/MemoQ 的协同

有道提供官方插件“YDT CAT Sync 2026”,可在 Trados Studio 2022 以上版本直接拉取云端术语。优先级字段会被写入 SDL MultiTerm 的“Usage”属性,数值 0–9 对应 0–9 级。若本地库已存在同名词条,插件默认“云端优先”,但可在设置里改为“本地优先”。

经验性观察:首次同步 1 万条术语大约需要 6 分钟,取决于欧洲节点延迟;建议避开北京时间 15:00–17:00 高峰期,可缩短 30%。

与 Trados/MemoQ 的协同
与 Trados/MemoQ 的协同

验证导入是否生效

1. 在“翻译框”输入测试句,例如“Insert the cartridge into the slot”。若术语库中 cartridge=墨盒(9),slot=插槽(8),则译文应出现“墨盒”与“插槽”。
2. 打开“术语高亮”开关(桌面端在查看→显示→术语高亮),命中词条会以蓝色下划线标出,鼠标悬停可见优先级数字。
3. 若未见高亮,优先检查语言方向是否匹配;有道区分“en-US→zh-CN”与“en-GB→zh-CN”,方向不一致时术语不生效。

性能副作用与缓解

当单库条目超过 5 万,在线翻译 API 的首字延迟会从平均 280 ms 升至 420 ms(样本:1 M 字符电商文案,网络 50 Mbps)。若对延迟敏感,可启用“边缘缓存”:在“企业控制台→API 管理→术语缓存”打开,命中术语将下沉至就近节点,延迟可降回 300 ms 内,但缓存更新需 15 分钟。

不适用场景清单

  • 实时语音同传:术语库仅作用于文本通道,语音流走独立模型,优先级策略不生效。
  • 离线 NMT 包:本地模型不含自定义术语,若需术语必须回退到在线。
  • 双语字幕时间轴:术语高亮会丢失时间戳,仅适合后编辑阶段。

最佳实践 6 条

  1. 按“项目+版本”命名库,如“Amazon2026Q1”,避免所有词条堆在一个默认库。
  2. 优先级留空策略:通用基础词用 5,品牌词用 7,法律免责用 9,保持梯队感。
  3. 上传前用 =LEN() 检查是否有隐藏空格,空格会导致“同词不同命”。
  4. 每季度导回 CSV 做差异比对,防止同事在云端误删。
  5. 超过 10 万行请拆库,并用“场景规则”绑定,避免单次 API 调用体> 2 MB 被网关丢包。
  6. 若团队含外部译员,开启“仅可读”权限,防止优先级被随意调高。

未来版本展望

官方公开路线图显示,2026 年夏将上线“AI 优先级推荐”,系统会根据历史语料自动建议冲突词条的优先级;同时会开放 GraphQL 接口,让自研 CMS 可实时推拉术语。若你所在企业有强合规需求,可提前申请“边缘容器”内测,实现术语库完全私有驻留。

收尾:一句话记住

批量导入节省的是时间,优先级顺序保住的是品牌一致性;先升级客户端,再下模板,最后验证高亮——三步走完,术语就不会在翻译里“迷路”。

常见问题

个人账号能否使用批量导入?

不能。入口仅在企业账号可见,个人账号需先升级至企业版并重新登录客户端。

优先级数字相同会怎样?

系统保留最新时间戳条目,旧条目自动移入回收站,界面无冲突提示,需自行核对。

能否在离线包里使用术语?

离线 NMT 包不含自定义术语,必须回退到在线通道才能生效。

超过 48 小时还能还原快照吗?

48 小时后自动清理,需手动导出当前库、删除冲突条目再重新导入。

边缘缓存多久更新一次?

默认 15 分钟;在控制台可手动刷新,刷新后 30 秒内全球节点同步完成。