StableVicuna 是 StabilityAI 推出的首个大型开源聊天机器人,采用了基于人类反馈的强化学习(RLHF)进行训练,源自于 Stable Diffusion。StableVicuna 是 Vicuna v0 13b 的进一步指令微调和 RLHF 训练版本,基于 LLaMA 130亿模型进行了指令微调。
相关导航
暂无评论...
StableVicuna 是 StabilityAI 推出的首个大型开源聊天机器人,采用了基于人类反馈的强化学习(RLHF)进行训练,源自于 Stable Diffusion。StableVicuna 是 Vicuna v0 13b 的进一步指令微调和 RLHF 训练版本,基于 LLaMA 130亿模型进行了指令微调。