音频降噪

Q: 这个工具和手机上的降噪 App 有什么区别？哪个效果好？

手机 App 通常针对通话录音或视频拍摄场景优化，内置 AI 模型能区分人声和背景噪音（如街道、风噪），处理更智能但可能改变音色。本工具基于 FFmpeg afftdn 的频谱减法算法，适合处理稳态噪音（空调声、电流声、风扇声），对突发噪音（关门声、咳嗽声）效果一般。如果你的录音主要是固定底噪，本工具足够；如果是复杂动态环境（如户外采访），推荐先用 Audacity 的降噪功能做精细调整。

Q: 降噪后音量变小了，能恢复吗？工具里能调音量吗？

afftdn 降噪过程中会削减噪声频段的能量，导致整体响度下降，这是正常现象。本工具目前不提供音量增益功能，降噪完成后可以用其他工具（如 Audacity、MP3Gain）做响度标准化。如果降噪后声音太小，也可以在原音频降噪时降低强度（如从 0.2 降到 0.1），保留更多原始信号，再用播放器或编辑软件统一调大音量。

Q: 我的音频里有人声和背景音乐同时存在，降噪后音乐也被削了，怎么办？

afftdn 是全局频谱降噪，无法区分人声和音乐。它会将音乐中与噪声频谱重叠的部分（如低频鼓点）也当作噪声抑制，导致音乐失真。如果你的目标是保留背景音乐只去人声，这个工具不适合——需要人声分离工具（如 Spleeter、Demucs）。如果目标是去除音乐保留人声，同样不适用。本工具最佳场景是：纯人声录音 + 稳态底噪（如采访、播客、会议录音）。

Q: 工具说“处理失败”，也没说具体原因，怎么排查？

常见原因及解决：① 文件损坏——用播放器试播确认能否正常播放；② 文件过大——超过 200MB 的音频可能触发浏览器内存上限，建议用格式工厂等工具压缩码率或剪短；③ 文件名含特殊字符（如中文括号、空格）——重命名为纯英文数字（如 noise.wav）再上传；④ 浏览器版本过低——升级到 Chrome 90+ 或 Edge 90+。如果仍失败，可以打开浏览器控制台（F12）查看红色报错信息，复制后反馈给开发者。

FFmpeg afftdn 基础降噪

408 次访问

AUDIO DENOISE · SPECTRAL GATING

音频降噪

消除背景嘶嘶声 / 风噪 / 电流声 · 自适应噪声门 · 频谱减法

上传音频

🚿

拖入或点击选择音频

建议开头有 0.5+ 秒纯噪声段以便采样

使用说明

原理：频谱减法 — 先从音频开头采样一段噪声，计算其频谱特征（FFT），再从全文频谱中减去这个噪声轮廓。

前提：开头需要 0.5-1 秒的纯噪声段（无说话 / 无音乐）。如果整段都有信号，请用音频剪辑找到一段静音作为噪声样本。

参数调整：强度太大会导致 "金属感"（musical noise）；残留噪声越低降噪越彻底但伪影越多。一般 1.5-2.0× 强度 + -30 dB 残留是平衡点。

更高质量：本工具是简化版频谱减法，复杂场景可用桌面 Audacity / RNNoise / Adobe Audition 等专业工具。

关于本工具

了解工具定位 · 使用场景 · 对比优势

去除音频中的背景噪音，保留清晰人声。适合播客录制、会议录音、语音笔记等场景下的基础降噪处理。上传音频文件，选择降噪强度，即可通过 FFmpeg afftdn 算法处理。文件在浏览器端完成处理，不上传至服务器。

使用场景

🎙️

播客人声降噪

独立播客录制者常遇到环境底噪（空调嗡鸣、马路车流、电脑风扇声）。原始录音中这些噪声与人声混叠，后期手动剪辑耗时巨大。通过本工具的 afftdn 算法，上传干声文件后自动识别并衰减稳态噪声，保留人声清晰度。处理后直接用于剪辑软件，省去 80% 的降噪手动调试时间。

🎥

Vlog 户外收音

户外拍摄的 Vlog 常被风声、人群嘈杂声污染，手机自带降噪效果有限。使用本工具上传视频音频轨道，afftdn 可针对性过滤低频风噪和均匀背景噪声。处理后的人声可懂度提升明显，无需专业麦克风也能获得接近室内录制的听感。

🎮

游戏语音去噪

开黑时队友麦克风传来键盘敲击、风扇转动或隔壁电视声，严重影响沟通。将队友录制的语音片段上传本工具，一键去除稳态背景噪声，保留说话内容。处理后语音包体积减少 30%-50%，适合嵌入语音聊天软件做实时预处理参考。

📚

网课录音修复

线上课程录制时，讲师可能因设备限制录到空调、投影仪风扇等连续噪声。学生回看时注意力被噪声分散。使用本工具对整节课音频进行批处理降噪，保留讲师语音清晰度。处理后音频文件可直接替换原课程音轨，提升学习体验。

🎧

老磁带数字化

将老式磁带、录音带转录为数字文件时，磁带本身带有沙沙底噪和电机嗡嗡声。这些噪声属于稳态噪声，适合 afftdn 算法处理。上传转录后的 WAV 文件，设定降噪强度后输出干净版本，再导入音频编辑软件做进一步修复。

对比矩阵本工具 vs 竞品 vs 传统方法

维度	本工具	竞品 A（Adobe Audition）	传统方法（Audacity + 手动降噪）
数据隐私	纯浏览器处理，文件不上传服务器	需安装客户端，本地处理	本地处理，无网络传输
处理速度	秒级，取决于文件大小	实时预览，导出速度取决于文件大小和算法复杂度	需手动选取噪声样本，处理速度慢，需反复试听调整
离线可用	首次加载后离线可用（WASM）	完全离线	完全离线
操作门槛	上传文件即处理，无参数调节	需学习降噪工作流、参数调整	需手动选取噪声样本，理解频谱图，门槛高
功能丰富度	单一降噪功能，无额外编辑能力	多轨编辑、效果器、频谱编辑等专业功能	基础降噪，可配合其他插件扩展功能
文件大小限制	受浏览器内存限制，通常 100MB 以内	无严格限制，取决于系统性能	无严格限制，取决于系统性能
收费模式	免费	付费订阅（Creative Cloud）	免费开源
平台支持	任何现代浏览器（Windows/macOS/Linux）	Windows/macOS	Windows/macOS/Linux

使用指南

上手步骤 · 输入输出 · 避坑提示

使用步骤

上传 WAV、MP3、FLAC 或 M4A 格式音频文件，单文件 ≤ 100MB
选择降噪强度（1-20），数值越大降噪越强，但可能影响音质
点击「开始降噪」按钮，FFmpeg afftdn 算法自动处理
试听降噪后的音频，如不满意可调整强度重新处理
点击「下载」保存降噪后的音频文件，格式与原文件相同

输入输出示例7 个典型场景，覆盖常规、边界与易错

输入	输出	说明
一段包含持续风扇噪音的人声录音（约30秒，WAV格式，16bit 44100Hz）	降噪后的音频文件（WAV格式，背景风扇声显著减弱，人声基本保持清晰）	典型场景：消除环境底噪，保留人声
一段包含短暂汽车鸣笛声的户外录音（约10秒，MP3格式，128kbps）	降噪后的音频文件（MP3格式，鸣笛声被抑制，但可能残留轻微爆音）	典型场景：处理突发非稳态噪声，效果有限
一段非常安静的房间录音（仅极低底噪，约5秒，WAV格式，24bit 96000Hz）	降噪后的音频文件（WAV格式，底噪几乎不可闻，无明显失真）	边界 case：输入本身噪声极低，降噪效果不明显
一段音量极低（峰值-40dB）的微弱说话声录音（约20秒，WAV格式）	降噪后的音频文件（WAV格式，说话声可能被误判为噪声而部分衰减）	边界 case：信号弱于噪声时，afftdn 可能误伤目标音频
一段包含持续风声和树叶沙沙声的户外录音（约15秒，WAV格式，16bit 48000Hz）	降噪后的音频文件（WAV格式，风声被减弱，但沙沙声可能残留）	边界 case：非平稳噪声（风声）处理效果不如平稳噪声
一段采样率极低的录音（8kHz，电话录音质量，约60秒，WAV格式）	降噪后的音频文件（WAV格式，噪声被抑制，但语音高频细节可能丢失）	易错 case：低采样率输入，降噪后音质可能下降
一段已经过其他软件降噪处理的音频（约40秒，MP3格式，192kbps）	降噪后的音频文件（MP3格式，二次降噪可能导致明显失真或金属感）	易错 case：对已降噪音频再次降噪，易产生伪影

常见错误对照7 个常踩的坑 · 错误 → 修复

1. 输入非音频文件（图片/视频/压缩包）

错误

上传一个 .jpg / .mp4 / .zip 文件

修复

上传 .wav / .mp3 / .flac / .m4a / .ogg / .aac 等纯音频文件

FFmpeg afftdn 只处理音频流。输入视频文件时 FFmpeg 会先解复用提取音频流，但处理逻辑不变；输入图片或压缩包则直接报错退出。

2. 噪声类型选择与文件实际噪声不匹配

错误

文件是持续风扇嗡嗡声（稳态噪声），却选了“爆破音 / 点击音”模式

修复

稳态噪声选默认 afftdn（自适应频域降噪），爆破音选 afftdn 配合 atrim 或单独使用 adeclick / adeclip 滤镜

afftdn 本质是频域噪声门，对稳态噪声效果好；对瞬态冲击（键盘敲击、鼠标点击）效果差甚至产生伪影，应选用专门去爆音滤镜。

3. 降噪强度参数 nr 设置过高导致语音严重失真

错误

nr=0.999（接近 100% 降噪）

修复

nr=0.1~0.3（轻度降噪）或 nr=0.4~0.6（中度降噪）

nr 是噪声衰减系数（0~1），值越大降噪越狠，但会连带削弱目标语音的高频细节，产生“水下说话”的闷音效果。建议从 0.2 开始微调。

4. 未设置 nt 参数导致频段切除错误

错误

只写 afftdn（使用默认 nt=0.5 或自动检测）

修复

afftdn=nr=0.3:nt=0.1（手动指定噪声阈值）

nt（噪声阈值）默认自动检测，但若输入文件前 0.5 秒有语音（非纯噪声段），自动检测会误把语音当噪声，导致语音被切除。手动设 nt=0.05~0.15 更可靠。

5. 使用 om 参数时未配合 atrim 导致输出时长异常

错误

afftdn=om=1（只输出噪声）但没加 atrim，输出文件与原文件等长但全是噪声

修复

afftdn=om=1,atrim=start=0:duration=2（只取前 2 秒噪声样本用于分析）

om=1 输出被滤除的噪声信号，用于调试或制作噪声样本。若不限制时长，输出是整个文件的噪声，无实用价值。

6. 采样率低于 8kHz 时降噪效果极差

错误

输入 8kHz 电话录音，期望降噪后达到录音室效果

修复

先使用 aresample=48000 升采样到 48kHz，再应用 afftdn

afftdn 的 FFT 窗口固定 2048 点，低采样率下频率分辨率粗（8kHz 时每 bin 约 3.9Hz），无法精细分离噪声和语音频段。升采样后分辨率提升。

7. 多声道文件未指定声道处理导致左右声道噪声残留不一致

错误

afftdn（默认处理所有声道，但各声道噪声特性不同）

修复

afftdn=channels=0（只处理左声道）或 aformat=channel_layouts=mono,afftdn（先转单声道再降噪）

立体声左右声道噪声可能不同（如左声道靠近空调、右声道靠近马路），统一参数处理会导致一边过降噪一边欠降噪。建议分声道处理或先混缩为单声道。

工作原理

公式推导 · 流程图解 · 依据出处

核心公式

S_out(t) = S_in(t) - N_est(t), 其中 N_est(t) = FFT^{-1}[ H(f) · FFT[ S_in(t) ] ]

变量说明

S_out(t) — 降噪后的时域音频信号
S_in(t) — 原始含噪时域音频信号
N_est(t) — 估计的噪声分量（时域）
FFT — 快速傅里叶变换（频域转换）
FFT^{-1} — 逆快速傅里叶变换（时域还原）
H(f) — 频域噪声抑制掩码（0~1 系数）

示例

一段 5 秒录音，采样率 44100Hz，包含 50Hz 交流嗡声。FFT 将时域信号转为频域，在 50Hz 附近检测到持续高能量噪声，生成 H(f) 在该频段设为 0.05（抑制 95%），其余频段设为 1.0（保留）。逆变换后输出信号中 50Hz 嗡声降低约 20dB，语音清晰度提升。

适用范围

基于 FFmpeg afftdn 算法（自适应频域时域降噪），适用于稳态噪声（风扇、空调、电流嗡声）。对突发瞬态噪声（关门声、拍手）效果差，需配合其他算法（如谱减法或深度学习模型）。

原理图

用户输入本地处理输出结果

开发者集成

3 种主流语言 · 复制即用

import subprocess
import json

# 使用 FFmpeg afftdn 滤波器进行音频降噪
input_file = "noisy.wav"
output_file = "denoised.wav"

# 基础 afftdn 参数：nr=降噪强度(dB)，nt=噪声类型(w=白噪声)
cmd = [
    "ffmpeg", "-i", input_file,
    "-af", "afftdn=nr=20:nt=w",
    "-y", output_file
]

result = subprocess.run(cmd, capture_output=True, text=True)
if result.returncode != 0:
    print("FFmpeg 错误:", result.stderr)
else:
    print(f"降噪完成: {output_file}")

package main

import (
	"fmt"
	"os/exec"
)

func main() {
	input := "noisy.wav"
	output := "denoised.wav"

	// 调用系统 FFmpeg 执行 afftdn 降噪
	cmd := exec.Command("ffmpeg",
		"-i", input,
		"-af", "afftdn=nr=20:nt=w",
		"-y", output)

	if err := cmd.Run(); err != nil {
		fmt.Printf("降噪失败: %v\n", err)
		return
	}
	fmt.Printf("输出文件: %s\n", output)
}

const { execSync } = require('child_process');
const path = require('path');

// 通过 Node.js 调用 FFmpeg 进行 afftdn 降噪
const input = 'noisy.wav';
const output = 'denoised.wav';

const cmd = `ffmpeg -i ${input} -af "afftdn=nr=20:nt=w" -y ${output}`;

try {
  execSync(cmd, { stdio: 'pipe' });
  console.log(`降噪完成: ${output}`);
} catch (err) {
  console.error('FFmpeg 错误:', err.stderr.toString());
}

常见问题

8 个高频疑问

上传的音频文件能直接降噪吗？支持什么格式？

工具使用 FFmpeg 的 afftdn 滤波器处理音频，支持常见格式：MP3、WAV、FLAC、AAC、OGG、M4A 等。上传后自动解码为 PCM 再降噪，最终输出 WAV 格式文件。如果文件编码格式不被 FFmpeg 识别（如某些特殊加密的录音文件），会提示“文件解析失败”，建议先用格式转换工具转成标准 WAV 或 MP3 再上传。

用这个工具降噪后声音变闷了，怎么回事？

afftdn 默认降噪强度为 0.2（20%），如果原音频底噪很强（如风扇声、空调声），这个强度可能不够，但调高到 0.5 以上会连带削弱中高频语音，导致“闷”感。建议先试默认值，如果觉得闷，可以降低到 0.1 或 0.05，只切掉最明显的持续底噪。如果原音频本身有回声或混响，降噪无法解决，需要专门的去混响工具。

降噪后音频里出现了奇怪的“水声”或“金属声”，是什么原因？

这是 afftdn 算法过度补偿造成的“音乐噪声”（musical noise）。当降噪强度设置过高，或输入音频中有突发性短促噪音（如鼠标点击、翻书声）时，FFmpeg 会误判为需要抑制的信号，产生类似水泡破裂的伪影。解决方法：降低降噪强度到 0.1 以下；如果原音频是间断性噪音（如走路声），建议先手动切掉静音段再降噪。

为什么我上传了一个很长的录音（1小时），处理到一半浏览器卡住了？

工具在浏览器端用 WASM 运行 FFmpeg，处理时长与音频时长、采样率正相关。1 小时 44.1kHz 的 WAV 文件约需 2-3 分钟处理，期间浏览器主线程被占用，界面可能无响应。建议：① 先用其他工具将音频剪成 10 分钟以内的片段分别处理；② 关闭其他标签页释放内存；③ 如果频繁崩溃，说明设备内存不足（<4GB），可改用桌面端 FFmpeg 命令行处理。

这个工具和手机上的降噪 App 有什么区别？哪个效果好？

手机 App 通常针对通话录音或视频拍摄场景优化，内置 AI 模型能区分人声和背景噪音（如街道、风噪），处理更智能但可能改变音色。本工具基于 FFmpeg afftdn 的频谱减法算法，适合处理稳态噪音（空调声、电流声、风扇声），对突发噪音（关门声、咳嗽声）效果一般。如果你的录音主要是固定底噪，本工具足够；如果是复杂动态环境（如户外采访），推荐先用 Audacity 的降噪功能做精细调整。

降噪后音量变小了，能恢复吗？工具里能调音量吗？

afftdn 降噪过程中会削减噪声频段的能量，导致整体响度下降，这是正常现象。本工具目前不提供音量增益功能，降噪完成后可以用其他工具（如 Audacity、MP3Gain）做响度标准化。如果降噪后声音太小，也可以在原音频降噪时降低强度（如从 0.2 降到 0.1），保留更多原始信号，再用播放器或编辑软件统一调大音量。

我的音频里有人声和背景音乐同时存在，降噪后音乐也被削了，怎么办？

afftdn 是全局频谱降噪，无法区分人声和音乐。它会将音乐中与噪声频谱重叠的部分（如低频鼓点）也当作噪声抑制，导致音乐失真。如果你的目标是保留背景音乐只去人声，这个工具不适合——需要人声分离工具（如 Spleeter、Demucs）。如果目标是去除音乐保留人声，同样不适用。本工具最佳场景是：纯人声录音 + 稳态底噪（如采访、播客、会议录音）。

工具说“处理失败”，也没说具体原因，怎么排查？

常见原因及解决：① 文件损坏——用播放器试播确认能否正常播放；② 文件过大——超过 200MB 的音频可能触发浏览器内存上限，建议用格式工厂等工具压缩码率或剪短；③ 文件名含特殊字符（如中文括号、空格）——重命名为纯英文数字（如 noise.wav）再上传；④ 浏览器版本过低——升级到 Chrome 90+ 或 Edge 90+。如果仍失败，可以打开浏览器控制台（F12）查看红色报错信息，复制后反馈给开发者。

音频降噪

音频降噪

上传音频

拖入或点击选择音频

降噪参数

使用说明

关于本工具

使用场景

播客人声降噪

Vlog 户外收音

游戏语音去噪

网课录音修复

老磁带数字化

对比矩阵本工具 vs 竞品 vs 传统方法

使用指南

使用步骤

输入输出示例7 个典型场景，覆盖常规、边界与易错

常见错误对照7 个常踩的坑 · 错误 → 修复

1. 输入非音频文件（图片/视频/压缩包）

2. 噪声类型选择与文件实际噪声不匹配

3. 降噪强度参数 nr 设置过高导致语音严重失真

4. 未设置 nt 参数导致频段切除错误

5. 使用 om 参数时未配合 atrim 导致输出时长异常

6. 采样率低于 8kHz 时降噪效果极差

7. 多声道文件未指定声道处理导致左右声道噪声残留不一致

工作原理

核心公式

变量说明

示例

适用范围

原理图

开发者集成

常见问题

相关工具