功能定位:为什么同传必须先做降噪

“麦克风降噪”并不是锦上添花,而是决定同传字幕是否可用的第一道闸门。嘈杂的空调、键盘敲击、翻纸声都会被 AI 当成语音输入,直接表现为错词、断句、乱码。降噪的本质是在送入 ASR(自动语音识别)前,先跑一层信号滤波,把非人声频段压低 12–20 dB,从而让人声信噪比提升。经验性观察:在 30 人会议室打开降噪后,同传字幕的“整句可用率”从约六成提到八成以上。

功能定位:为什么同传必须先做降噪
功能定位:为什么同传必须先做降噪

入口总览:三端路径与最短操作

Android / iOS(截至当前的最新版本)

  1. 打开有道翻译 App → 底部“同传”
  2. 右上角“⚙️ 设置”→“音频输入”
  3. 打开“麦克风降噪”开关即可,无需重启

移动端路径最浅,三步即可完成;若经常换会议室,建议把“同传”页固定在底部导航栏,减少每次寻找入口的时间。

Windows 桌面客户端

  1. 主界面左侧“同传”→ 右上角“⋮”→“音频设置”
  2. 勾选“启用麦克风降噪(RNNoise)”
  3. 若外接多麦克风,记得在“输入设备”下拉框先选对实体硬件

Windows 版默认使用 RNNoise 模型,勾选后即时生效;切换麦克风后务必点“测试降噪”确认,避免系统仍调用笔记本自带麦克风。

macOS 桌面客户端

  1. 顶部菜单“同传”→“偏好设置”→“音频”
  2. 同样勾选“麦克风降噪”即可;macOS 14 以上需额外授予“麦克风访问”权限

提示:设置页下方有“测试降噪”按钮,可原地录制 5 秒回放,建议每次换会议室都点一次,确认底噪被压掉。

工作原理:RNNoise 与内置 AGC 如何分工

有道翻译同传采用的是开源 RNNoise 神经网络降噪 + 自研 AGC(自动增益控制)两层结构。RNNoise 负责“把非人声抹掉”,AGC 再把有效语音放大到标准 dBFS 区间,防止声音过小导致识别置信度下降。两者默认级联且不可单独关闭,这是为了避免用户只开增益而把背景噪音一起放大。

示例:在 45 dB 空调噪声环境下,RNNoise 可将 200–400 Hz 的轰鸣衰减 18 dB,随后 AGC 把剩余人声提升 10 dB,最终送入 ASR 的信号信噪比提高约 28 dB,错词率下降近一半。

场景映射:不同会议形态下的取舍

场景 是否建议开降噪 原因 / 注意
30 人现场圆桌 ✅ 强烈建议 空调、投影机噪声大,不开字幕几乎不可用
1 对 1 线上访谈 可选 双方戴耳机时底噪低,开降噪对识别提升有限
音乐演出同传 ❌ 不建议 RNNoise 会误杀乐声,导致歌词大面积缺失

例外与副作用:何时必须关掉降噪

  • 远场多人轮流喊话:降噪算法会把 2 米外的小音量人声当成噪音,出现“第一句永远漏字”现象。经验性观察:在 3 米半径内,如果发言人音量低于 55 dB,整句被抹掉的概率明显升高。
  • 高保真录音需求:若你同时用 OBS 录制原声做纪要,降噪后的音频会被永久改写,后期无法恢复。此时应在“音频设置”里把“输出通道”切到“原始+降噪双轨”,本地录原始轨,同传内部用降噪轨。

示例:圆桌讨论时,若发言人距离笔记本麦克风 2.5 米,且未外接指向麦,建议先关闭降噪,改用高灵敏度麦克风+手动增益,否则首字丢失率可能超过 20%。

例外与副作用:何时必须关掉降噪
例外与副作用:何时必须关掉降噪

验证方法:30 秒自测流程

  1. 找一段持续空调声背景,先关闭降噪,朗读屏幕随机生成的 50 字文本,记录同传字幕。
  2. 立即打开降噪,原地再读同一文本,对比两次字幕的“错词数/断句数”。
  3. 若错词减少 ≥30 % 且断句正常,即可认定当前场境下降噪有效;否则考虑换麦克风或调整拾音距离。

警告:不要以“是否还有背景嗡嗡声”作为唯一指标,RNNoise 会保留少量底噪防止声音“断层”,关键看字幕准确率。

麦克风硬件:低成本也能提升 10 dB 信噪比

再强的算法也救不了 20 元领夹麦。经验性观察:把自带耳机麦换成 200 元级定向拾音手雷麦(超心型指向),在 1 米距离内,系统输入信噪比可再提高 8–12 dB,同传错词率还能再降一半。若预算充足,优先选“带硬件级降噪”的 USB 会议扬声器,算法+硬件两层过滤,现场 50 人路演也能稳定输出字幕。

故障排查:开了降噪反而更差?

现象 可能原因 处置
字幕大面积空白 麦克风增益过低→RNNoise 把人声也抑制 系统设置里把麦克风增益拉到 70 % 以上,再用“测试降噪”回放确认
声音断续、像机器人 CPU 占满导致 RNNoise 帧丢失 关闭其他高占 App,或在设置里把“性能模式”切为“优先流畅”
Android 端出现尖锐啸叫 扬声器回采到麦克风形成正反馈 插入耳机或关闭外放,啸叫立即消失

最佳实践清单:会前 5 分钟速查表

  1. 确认系统麦克风权限已授予(Android 需“允许后台录音”)。
  2. 插好定向麦 → 输入设备下拉框选对型号 → 点“测试降噪”回放通过。
  3. 关闭房间里的蓝牙音箱,防止被系统误选成“输入”。
  4. 把“字幕字体大小”提前调到 120 %,避免观众后续看不清。
  5. 会前 30 秒开“同传记录”,自动生成带时间戳的 txt,方便会后分发。

FAQ:麦克风降噪 5 个高频疑问

离线同传时降噪还生效吗?

生效。离线语音包已集成轻量 RNNoise 模型,但 CPU 占用会比云端高 5–8 %,老旧机型建议关闭其他 App。

能不能只让降噪作用于字幕,不作用于本地录音?

可以。在“音频设置”里把“输出通道”改为“双轨”,原始轨供本地录,降噪轨仅供同传内部识别,两路互不干扰。

iOS 端找不到“麦克风降噪”开关?

请确认系统版本 ≥ iOS 15 且 App 已升至“截至当前的最新版本”。若仍无选项,卸载重装即可刷新功能模块。

降噪会让中英混合识别变差吗?

不会。RNNoise 只处理声学层,语言层仍由子曰 3.0 多语种模型负责,经验性观察中英混说场景下错词率无显著差异。

打开降噪后延迟会增加多少?

官方标称 <200 ms 的同传总延迟已包含降噪环节,实测亚秒级内几乎无感;若设备 CPU 性能低于 i5-8 代,可能出现 30–50 ms 级额外抖动。

总结与下一步行动

麦克风降噪是“会议同传字幕可用”的最低成本杠杆:只需一次开关,就能把错词率压到可接受区间。会前用“测试降噪”原地回放 5 秒,是避免现场翻车最快验证;若环境远场或需高保真录音,记得切双轨输出。下一步,把本文的 5 分钟速查表存成会议模板,下次国际会议前直接照表打钩,就能让中英双语字幕稳定输出,无需临时抱佛脚。

未来版本预期:经验性观察,官方持续优化 RNNoise 模型体积与功耗,后续可能在低端安卓机上推出“轻量降噪”选项,进一步降低 CPU 占用,值得持续关注更新日志。