- librosa 替换为 torch + torchaudio - 音频直接加载到 GPU - 预计算 STFT 共享给所有分析器(避免重复计算) - 单首歌评估: ~200MB 显存, ~2秒 (4090) - 评估完成自动释放 GPU 显存
4 lines
49 B
Plaintext
4 lines
49 B
Plaintext
torch>=2.0.0
|
|
torchaudio>=2.0.0
|
|
soundfile>=0.12.0
|