Loading...

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

GoodNav 11 月 3 日报道,中国电信人工智能研究院(TeleAI)在今年 5 月推出了业界首个支持 30 种方言混合语音识别的大模型 —— 星辰超多方言语音识别大模型。

距离上一次发布不到半年,TeleAI 星辰语音大模型的多方言功能再度升级,成功加入了湛江话、宜宾话、洛阳话、烟台话等方言,方言种类从 30 种增加到了 40 种,并支持英文识别

与传统的标注训练方式不同,TeleAI 采用预训练语音识别模型,利用大量无标注数据进行预训练,再通过少量有标注数据进行微调。

由于方言语音数据通常存在无标注数据多而有标注数据少的情况,这种“预训练 + 微调”的模型方案与方言场景的实际需求高度匹配。

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

TeleAI 在模型结构和成本优化方面也进行了创新,使对人工标注数据的需求量大幅降低约 50 倍,同时确保模型效果与有监督训练的方言模型相当。

附 GitHub 开源地址:https://github.com/Tele-AI/TeleSpeech-ASR

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...