Loading...
AI人工智能AI训练模型

StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

标签:

StableVicuna 是 StabilityAI 推出的首个大型开源聊天机器人,采用了基于人类反馈的强化学习(RLHF)进行训练,源自于 Stable Diffusion。StableVicuna 是 Vicuna v0 13b 的进一步指令微调和 RLHF 训练版本,基于 LLaMA 130亿模型进行了指令微调。

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...