Meta 高管澄清:新 AI 模型 Llama 4 训练“作弊”传言不属实
GoodNav 4 月 8 日报道,Meta 公司的一位高层管理者针对有关该公司新 AI 模型的虚假传闻进行了澄清。传闻称,Meta 在其新推出的 Llama 4 Maverick 和 Llama 4 Scout 模型上存在不当行为,即通过在特定基准测试的“测试集”上训练来提升模型的测试结果,同时掩盖模型的缺陷。
Meta 公司的生成式人工智能副总裁艾哈迈德・阿尔・达赫勒(Ahmad Al-Dahle)在社交媒体 X 上表示,这种说法“完全不属实”。
在人工智能领域,测试集是用于评估模型性能的数据集,通常在完成训练后使用。如果在测试集上进行训练,可能会人为提高模型在基准测试中的分数,从而使模型看起来比实际更强大。
需要指出的是,Maverick 和 Scout 在某些任务中的表现不尽如人意,加之 Meta 选择使用未发布的实验版本 Maverick 在基准测试平台 LM Arena 上获取更好成绩的决策,为这一谣言提供了“素材”。研究人员发现,可公开下载的 Maverick 与在 LM Arena 上托管的模型在表现上存在明显差异。
阿尔・达赫勒承认,一些用户在使用不同云服务提供商提供的 Maverick 和 Scout 模型时,的确遇到了“质量参差不齐”的现象。他解释道:“由于我们在模型准备就绪后立即发布,预计需要几天时间才能让所有公开版本的实现统筹到位。我们将继续进行错误修复,并与合作伙伴沟通对接。”
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...