Loading...

克服奖励欺骗:Meta 发布全新后训练方式 CGPO 编程水平直升 5%,打破 RLHF 瓶颈

CGPO 框架通过结合混合评审机制与约束优化器,有效应对了 RLHF 在多任务学习中的奖励欺骗和多目标优化挑战,从而显著提升了语言模型在多任务环境中的性能。这...

苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

11 月 2 日消息,《洛杉矶时报》昨日(11 月 1 日)发布博文,报道称苹果研究团队测试了 20 个最先进的 AI 模型,发现在有干扰项存在的情况下,它们处理简单...

迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力

11 月 2 日消息,据路透社报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,这家媒体巨头正积极探索 AI 等技术在电...

谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失

AI 首次在现实世界中发现重大安全漏洞!一个存在于 SQLite 中的漏洞,竟然被谷歌研究者的 AI Agent 及时辨识并修复,避免了潜在损失。难道 AI 在进化后,可以...

马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读能力还能打牌

通过将一块 2mm 大小的芯片植入视网膜,并配合摄像头眼镜,盲人可以成功恢复视力!不仅能够重拾阅读,还有可能打牌。这项创新成果来自于加州一家脑机接口公司...

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

11 月 3 日消息,中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。

谷歌 DeepMind 顶尖研究员 Julian Schrittwieser 加入 Anthropic,曾参与开发 AlphaGo 等

10 月 30 日消息,谷歌 DeepMind 顶尖研究员 Julian Schrittwieser(朱利安・施特维泽)10 月 29 日宣布加入 AI 公司 Anthropic。

开发者让微软大眼夹“重生”,变身截屏解读 AI 助手

10 月 30 日消息,一款名为 AI-Snip 的工具近期在 Reddit 上引发关注,该工具能够通过截屏的方式,自动调用 AI 模型对选定区域进行解释、翻译、生成 LaTeX 代...

消息称 Kimi、豆包等 AI 应用本月广告投放超 3 亿元,开始“卷”投流

10 月 30 日消息,据钛媒体 App 今日报道,截至 10 月 29 日,kimi 智能助手、字节跳动豆包、腾讯元宝等所有 AI 应用 10 月全网广告投放(投流)支出超过 3 ...

养猪业新神器,AI 工具可解读猪叫声背后的情绪

10 月 30 日消息,路透社于 10 月 24 日发布博文,报道称欧洲科学家开发了一种能够解读猪叫声的人工智能(AI)算法,从而帮助猪农了解猪的情绪和压力状态。
1 7 8 9 10 11 36