Loading...

苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进

GoodNav 4 月 15 日报道,苹果公司在昨日(4 月 14 日)发布了一篇博文,揭示了其人工智能隐私保护的核心技术细节,尤其强调了差分隐私和合成数据在 Apple Intelligence 中的应用。

差分隐私保护 AI 发展

以生成 Genmoji 表情为例,当用户选择共享设备分析数据时,系统会通过随机噪声算法收集高频指令(例如“戴着牛仔帽的恐龙”),却不会记录频率太低的个性化指令,所有数据也与设备 ID 完全解耦。

在具体实现中,设备会随机返回真实指令片段或干扰信号,只有当某个指令被数百台设备同时提交后,系统才会进行识别。这种机制已有效提升了多实体组合表情生成的准确性,并且在整个过程中未接触任何 IP 地址等敏感信息。

合成数据解决长文本挑战

针对需要处理长文本的功能如邮件摘要,苹果公司开发了专门的合成数据解决方案。首先,利用大语言模型批量生成虚拟邮件(例如“明早 11:30 打网球吗?”),并将其转化为包含主题和语言特征的数字向量(embedding)。苹果官方博文中演示的图如下:

苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进

参与该计划的设备会在本地计算真实邮件的向量,借助差分隐私技术匿名反馈与之最接近的合成向量类型。经过多轮迭代,系统最终形成一个能够反映真实邮件分布规律的合成数据集,而在整个过程中并未接触到原始邮件内容。目前,该技术已在测试版的邮件摘要功能中验证其效果,未来还将扩展到写作助手等场景中。

隐私原则贯穿技术发展

苹果在博文中强调,Apple Intelligence 所有模型的训练都采用去标识化数据,并会预先过滤诸如社交安全号等敏感信息。

即将在发布的 iOS 18.5 等系统中,差分隐私和合成数据技术将扩展到 Image Wand 图像处理、记忆相册生成等十多项功能。苹果重申,即便用户启用设备分析计划,其个人数据始终会加密存储在本地,公司仅会获得经过数学验证的群体趋势报告。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...