- librosa 替换为 torch + torchaudio - 音频直接加载到 GPU - 预计算 STFT 共享给所有分析器(避免重复计算) - 单首歌评估: ~200MB 显存, ~2秒 (4090) - 评估完成自动释放 GPU 显存
- 7 大维度分析器: 节奏/可舞性/能量/情绪/调性/音色/音频质量 - 6 种场景配置: pop/classical/electronic/rock/jazz/hiphop - 4 个 API: scenes/dimensions/config/evaluate - 基于 librosa 的纯算法分析(CPU 即可运行) - nginx IP 白名单认证(无 RBAC)