苹果揭秘 Apple 智能开发：差分隐私 + 合成数据，隐私原则贯穿 AI 技术演进

120 0 0

GoodNav 4 月 15 日报道，苹果公司在昨日（4 月 14 日）发布了一篇博文，揭示了其人工智能隐私保护的核心技术细节，尤其强调了差分隐私和合成数据在 Apple Intelligence 中的应用。

差分隐私保护 AI 发展

以生成 Genmoji 表情为例，当用户选择共享设备分析数据时，系统会通过随机噪声算法收集高频指令（例如“戴着牛仔帽的恐龙”），却不会记录频率太低的个性化指令，所有数据也与设备 ID 完全解耦。

在具体实现中，设备会随机返回真实指令片段或干扰信号，只有当某个指令被数百台设备同时提交后，系统才会进行识别。这种机制已有效提升了多实体组合表情生成的准确性，并且在整个过程中未接触任何 IP 地址等敏感信息。

合成数据解决长文本挑战

针对需要处理长文本的功能如邮件摘要，苹果公司开发了专门的合成数据解决方案。首先，利用大语言模型批量生成虚拟邮件（例如“明早 11:30 打网球吗？”），并将其转化为包含主题和语言特征的数字向量（embedding）。苹果官方博文中演示的图如下：

苹果揭秘 Apple 智能开发：差分隐私 + 合成数据，隐私原则贯穿 AI 技术演进

参与该计划的设备会在本地计算真实邮件的向量，借助差分隐私技术匿名反馈与之最接近的合成向量类型。经过多轮迭代，系统最终形成一个能够反映真实邮件分布规律的合成数据集，而在整个过程中并未接触到原始邮件内容。目前，该技术已在测试版的邮件摘要功能中验证其效果，未来还将扩展到写作助手等场景中。

隐私原则贯穿技术发展

苹果在博文中强调，Apple Intelligence 所有模型的训练都采用去标识化数据，并会预先过滤诸如社交安全号等敏感信息。

即将在发布的 iOS 18.5 等系统中，差分隐私和合成数据技术将扩展到 Image Wand 图像处理、记忆相册生成等十多项功能。苹果重申，即便用户启用设备分析计划，其个人数据始终会加密存储在本地，公司仅会获得经过数学验证的群体趋势报告。

文章版权归作者所有，未经允许请勿转载。

GoodNav.net

1.4K

GoodNav.net

705

GoodNav.net

650

GoodNav.net

650

GoodNav.net

1.3K

GoodNav.net

1.2K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...