Riffusion 是一个免费的开源实时音乐和音频生成库,具有稳定扩散功能。用户只需提供音乐描述,AI 就能生成相应风格的音乐。该项目由 Seth Forsgren 和 Hayk Martiros 开发,其原理基于对 Stable Diffusion(文本生成图像模型)进行微调,以生成频谱图。频谱图是音频的视觉表现,展示了不同频率随时间变化的振幅,随后将高保真的频谱图像转换为音频。
相关导航
暂无评论...
Riffusion 是一个免费的开源实时音乐和音频生成库,具有稳定扩散功能。用户只需提供音乐描述,AI 就能生成相应风格的音乐。该项目由 Seth Forsgren 和 Hayk Martiros 开发,其原理基于对 Stable Diffusion(文本生成图像模型)进行微调,以生成频谱图。频谱图是音频的视觉表现,展示了不同频率随时间变化的振幅,随后将高保真的频谱图像转换为音频。