Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知
GoodNav 4月24日消息,Anthropic 昨天(4月23日)发布报告,指出Claude等先进AI模型正被不法分子滥用,用于“舆论操控服务”、“凭证盗取”、“招聘诈骗”和“恶意软件开发”等活动。
Anthropic为Claude模型实施了多项安全措施,成功阻止了部分有害输出,但恶意攻击者仍在试图规避这些保护。报告通过多个案例揭示了攻击者如何利用AI进行复杂操作,包括政治宣传、身份盗窃、虚假招聘以及恶意软件制造。
其中,一个案例尤其引人注目:一个组织利用X和Facebook创建了超过100个虚假账号,无需人工干预,并使用多种语言发布评论,伪装成真实用户,成功与数万名真实用户互动,传播带有政治偏见的观点。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...