Loading...

智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣

GoodNav 10 月 25 日报道,智谱今日宣布推出 GLM-4-Voice 端到端情感语音模型。官方表示,该模型具备情感理解、情绪表达和情感共鸣的能力,用户可以自主调整语速,支持多种语言与方言,且具有更低的延时和随时打断的功能,用户现在可以在“智谱清言”App 上进行体验。

根据介绍,GLM-4-Voice 具备以下特点:

  • 情感表达与共鸣:声音中包含多种情感及其细腻变化,如开心、悲伤、生气、恐惧等。

  • 语速调节:在同一次对话中,用户可以请求其快说或慢说。

  • 灵活打断与指令输入:根据用户实时指令,调整语音输出内容与风格,支持更加灵活的对话互动。

  • 支持多语言与方言:目前 GLM-4-Voice 支持中英文语音及各地方方言,尤其在粤语、重庆话和北京话等方面表现出色。

  • 结合视频通话,能看能说:视频通话功能即将上线。

此外,智谱的 AutoGLM 具有手机使用功能,只需接收简单的文字或语音指令,即可模拟人类的手机操作。它不受限于简单任务场景或 API 调用,也无需用户手动构建复杂的工作流,操作逻辑更贴近人类。

GLM-4-Voice 同时对外开源,官方称其为智谱第一款开源的端到端多模态模型。相关地址如下:

代码仓库:

  • https://github.com/THUDM/GLM-4-Voice

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...