Audiobox是Meta于2023年11月30日发布的一个免费的开源AI语音和声音生成模型,并于12月11日推出了在线网页版本,用户可以免费体验该模型的功能。Audiobox是Meta在Voicebox之后推出的最新一代音频生成模型,能够结合语音输入和自然语言文本提示生成语音和音效,从而轻松为各种应用场景创建逼真的自定义音频。
Audiobox的核心功能
- 声音克隆:录制用户的声音,按照用户的声音风格或任意音频样本的风格生成语音
- 文本描述生成语音:根据文本描述声音风格的特征和声学环境生成语音
- 声音风格转换:可以结合声音和文本描述来改变现有的声音风格
- 文本描述生成音效:根据输入的声音特征文本描述生成音效
- 噪声消除:提供Magic Eraser功能以消除录音中的瞬态噪声
- 声音替换:根据文本描述用新的声音替换音频中的某一部分
- 音频故事创作工具:结合以上功能,利用Audiobox Maker制作原创有趣的音频故事
相关导航
暂无评论...