Loading...

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

AI前沿资讯5个月前发布 GOODNAV.NET

1.2K 0 0

GoodNav 11 月 3 日报道，中国电信人工智能研究院（TeleAI）在今年 5 月推出了业界首个支持 30 种方言混合语音识别的大模型 —— 星辰超多方言语音识别大模型。

距离上一次发布不到半年，TeleAI 星辰语音大模型的多方言功能再度升级，成功加入了湛江话、宜宾话、洛阳话、烟台话等方言，方言种类从 30 种增加到了 40 种，并支持英文识别。

与传统的标注训练方式不同，TeleAI 采用预训练语音识别模型，利用大量无标注数据进行预训练，再通过少量有标注数据进行微调。

由于方言语音数据通常存在无标注数据多而有标注数据少的情况，这种“预训练 + 微调”的模型方案与方言场景的实际需求高度匹配。

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

TeleAI 在模型结构和成本优化方面也进行了创新，使对人工标注数据的需求量大幅降低约 50 倍，同时确保模型效果与有监督训练的方言模型相当。

附 GitHub 开源地址：https://github.com/Tele-AI/TeleSpeech-ASR

# AI前沿资讯

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

DeepMind 资深科学家从谷歌离职创办机器人初创公司，获英伟达投资

GoodNav.net

550

英伟达发布 Llama-3.1-Nemotron-51B AI 模型：创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

GoodNav.net

1.6K

理想同学 App 明日上线，支持语音交流、识物等功能

GoodNav.net

2.3K

Adobe 将推出全新免费应用：创作者可在作品上附上“证书”防止被 AI 使用

GoodNav.net

1.2K

谷歌升级 Gemini 2.0 系列模型，AI 助手可免费深度推理

GoodNav.net

470

Lumigator 评估框架登场：Mozilla 赋能开发者 AI 旅程，助其选择最佳模型

GoodNav.net

1.2K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2024 goodnav.net All Rights Reserved