功能定位:为什么必须“批量+去重”

2026 版有道翻译客户端把术语库(TB)抬到与企业记忆库同权的位置,成为“文档版式还原”前的最后一道闸口。当电商 SKU、游戏剧情或专利说明书一次性涌进上千条新词,逐条录入显然不现实;而简单追加又会让“Android-安卓/安致”这类历史冗余重新混入,直接拉低后续 CAT 插件命中率。官方给出的“一次干净”方案就是:批量导入 CSV 并触发内置去重,先清后灌,后续翻译才能稳态输出。

功能定位:为什么必须“批量+去重”
功能定位:为什么必须“批量+去重”

前置检查:文件格式与权限

CSV 字段顺序与编码

经验性观察:官方模板只要三列——①源语言词条 ②目标语言词条 ③备注(可选)。列名必须是英文 header:source, target, comment;文件须保存为 UTF-8 with BOM,否则简体中文会变成“鑻”一类乱码。验证方法:用记事本打开后另存,确认编码下拉框为“UTF-8 with BOM”。

账号等级与库容量

截至当前最新版本,个人免费号单库上限 5 000 条,教育版 20 000 条,企业版 100 000 条。超出后系统提示“容量已满”并中断导入,不会部分写入。动手前先在“术语库管理→设置→统计”里瞄一眼剩余额度,可省一次往返。

操作路径:桌面端最短入口

  1. 打开有道翻译客户端(Win / macOS 通用界面)。
  2. 左侧边栏切换“术语库”→右上角“⋮”→“批量导入”。
  3. 在弹窗中选择“CSV 文件”,点击“上传”。
  4. 勾选“自动去重”复选框(默认开启)。
  5. 映射字段确认无误后,点“开始导入”。
  6. 等待进度条完成,系统会给出“成功条数 / 跳过重复”双计数。

若找不到“⋮”,请先升级至“截至当前的最新版本”;早期入口藏在“设置→语言资产→高级”,官方已在 2026 年 1 月迁出。

移动端能否完成?

Android 与 iOS 的“术语库”Tab 目前仅支持单条添加与查看,批量导入被隐藏。出差在外可先把 CSV 扔进“协作空间”团队网盘,回公司后在桌面端一键同步,前后不过十秒。

去重规则拆解:何时会被判“重复”

  • 完全匹配:source 与 target 文本均相同,大小写不敏感。
  • 源冲突:source 相同但 target 不同,系统视为冲突条目,默认“跳过旧保留新”,可在设置改为“跳过新保留旧”。
  • 备注差异:不影响去重逻辑,仅作为附加字段写入。

工作假设:同一 CSV 内若出现多条 source 相同、target 不同,排在前面的优先写入,后续均被记为冲突跳过。验证方法:准备 3 行测试文件,故意制造冲突,导入后查看日志,可复现“跳过 1 条”提示。

失败分支与回退方案

编码错误导致 0 条成功

现象:上传后立刻提示“解析失败”。解决:另存为 UTF-8 with BOM;若使用 macOS Numbers,请导出“CSV-Windows”格式。

容量超限部分写入

现象:提示“导入中断”。解决:删除历史无用术语或申请扩容,再次导入时系统会跳过已写入条目,不会重复增加。

误覆盖旧条目

若去重策略选错,可在“术语库→回收站”找回 30 日内被覆盖的条目,单条还原或整批还原均可。

与 CAT 工具协同的注意事项

有道提供官方 Trados Studio 插件(可在 AppStore 内搜索“Youdao Term Plugin”)。术语库批量更新后,需在 Trados 里手动“重新加载远程资源”,否则本地缓存仍保留旧译。经验性观察:约 80% 的“术语未命中”投诉源于未 reload,而非去重失败。

与 CAT 工具协同的注意事项
与 CAT 工具协同的注意事项

性能与耗时参考

在 16 GB 内存、SSD 的 Win11 参考机上,导入 50 000 条、平均 12 个汉字长度的术语,耗时约 90 秒;其中去重阶段占 30 秒。若开启“冲突弹窗确认”,每百条冲突会增加约 5 秒人工点击时间。

适用 / 不适用场景清单

场景是否推荐原因
跨境电商大促,一次更新 3 000 商品词✅ 强烈推荐命中率高,且去重可避免“蓝牙耳机/Bluetooth Earphone”并存
法律合同,需保留历史冲突版本❌ 不推荐去重会覆盖旧译文,建议关闭自动去重,改用“冲突手动”模式
游戏剧情,词条含大量变量 {0}⚠️ 谨慎变量会被算入去重,导致“{0}金币/{0}Gold”被误判重复

最佳实践 6 步检查表

  1. 提前在“统计”确认剩余容量。
  2. 用官方模板字段,拒绝多余列。
  3. 保存为 UTF-8 with BOM,并用记事本二次确认。
  4. 先在测试子库导入 100 条,验证去重策略。
  5. 正式导入时勾选“生成日志”,便于事后审计。
  6. 导入完成立刻在 CAT 工具 reload,确保命中。

FAQ:必须用结构化数据

可以一次性导入 Excel 吗?

官方只接受 CSV。请把 .xlsx 另存为“CSV (逗号分隔)”并确保 UTF-8 with BOM。

去重区分大小写吗?

不区分。Apple 与 apple 会被视为同一条。

能否撤回本次导入?

系统不提供“一键撤回”,但可在回收站按日期批量还原被覆盖条目。

收尾:下一步行动

批量导入 CSV 术语库并自动去重,本质是把“数据清洗”前移到翻译流程最上游。看完本篇,先下载官方模板做 100 条小试验,确认去重策略与 CAT 插件 reload 时机;验证无误后,再把全量词库一次性灌入,真正让有道翻译的 NNMT-3.0 引擎在电商、游戏或学术场景下输出“零冗余、高命中”的译文。术语库干净,后续文档翻译、同传字幕乃至写作助手的“可读性评分”都会同步受益——这一步值得你现在就试。