Claude 3.5 编程收入暴增 10 倍,抢走 Cursor 反杀 OpenAI
虽然 OpenAI 面临众多竞争对手,然而没有哪家像 Anthropic 一样让 OpenAI 高层如此感到压力山大。
曾几何时,AI 编程是 OpenAI 的强项,也是数百万用户选择 ChatGPT 的主要原因之一。
然而,今年 7 月,那家曾获得 OpenAI 投资的明星初创公司 Cursor,毫不犹豫地将其 AI 编程助手的默认模型从 GPT 更换为 Claude。
不仅如此,Cursor 的联合创始人 Aman Sanger 更是在 10 月 Lex Fridman 的播客中称赞 Anthropic:
「因对用户需求的深入理解,最新版本的 Claude 3.5 Sonnet 可以说是目前“最佳”的编程工具。」
巧合的是,OpenAI 在初秋时也通过内部基准测试发现,自家的模型在自动编程任务上远远落后于 Anthropic。
这一切都让 OpenAI 的高层深感震惊。
看着 Anthropic 在编程领域的成功迅速转化为商业成果——过去三个月中,该公司来自软件开发和代码生成业务的年化收入激增了十倍。
为遏制这种趋势,OpenAI 开始紧急提升自家模型的编程能力。
不过,成立早于 Anthropic 五年的 OpenAI,依然在营收上拥有明显优势:预计今年 OpenAI 的收入将达到约 400 亿美元,是 Anthropic 的五倍以上。
从规模上看,OpenAI 也大大超越了 Anthropic:OpenAI 总共筹集了 2000 亿美元资金,最高估值达 1570 亿美元,而 Anthropic 的融资额为 110 亿美元,最高估值也仅为 180 亿美元。
在财务健康方面,OpenAI 还显得更为强劲:与云服务提供商微软的分成比例,低于 Anthropic 与亚马逊之间的比例。
由于开发和运营 AI 技术所需的费用极其高昂,OpenAI 和 Anthropic 今年均在大规模投入资金,规模都达到数十亿美元。
另一个值得关注的是,OpenAI 还计划开发自己的数据中心芯片和其他硬件,以减少对外部供应商的依赖,这意味着他们在可预见的未来还需要持续寻求资金支持。
在过去的发展中,Anthropic 一直保持对安全性高度重视的自我约束。
这里的“安全性”意味着 AI 公司为防止模型出现严重失误或实施对人类生命造成威胁的行为——例如自主研发生物武器或实施核打击。(如果公司主动将模型提供给美国军方使用,则不算在内)
Anthropic 的七位联合创始人均曾在 OpenAI 工作,但由于对 AI 安全的担忧,他们于 2020 年底选择离开。
根据 Anthropic 首席执行官 Dario Amodei 的说法,早在 2022 年夏季,公司就已经开发出了 AI 聊天机器人,但他们选择继续进行安全性测试,而不是急于发布。
2022 年 11 月,OpenAI 发布 ChatGPT,立即引发业界和公众的热烈反响。四个月后,Anthropic 才推出了他们的 Claude。
最近,Anthropic 在挑战 OpenAI 这一巨头时,越来越大胆。
今年 10 月,在包括首席技术官 Mira Murati 在内的多位高管离开 OpenAI 后,Anthropic 在旧金山国际机场投放了关于 Claude AI 的广告,暗中讽刺道:“这是一个没有戏剧性的选择。”
在实验性产品发布方面,他们的决策也更加果断。
10 月,尽管公司在博客中承认存在潜在的网络安全风险,仍推出了一个创新功能——Computer Use。
该功能使 Claude 模型能够像人类一样操作计算机,不仅能够查看屏幕,移动光标,还可以按下按钮、输入文本!
这一举动在 OpenAI 内部引起了嘲讽。
在最近的一次会议上,OpenAI 的高层讽刺了 Anthropic 的这一决定,认为这与它们所倡导的 AI 安全理念相悖。
创始人背后另一段恩怨,项目之争私建小组
实际上,Anthropic 与 OpenAI 之间的矛盾,比外界所知的要复杂得多。在因 AI 安全理念的分歧而分道扬镳之前,创始人之间的冲突早已埋下了种子。
作为 OpenAI 的研究副总裁,Dario Amodei 曾领导 GPT-2 和 GPT-3 模型的开发,并与 OpenAI 和谷歌 DeepMind 等研究人员共同撰写了一篇关于人类反馈强化学习(RLHF)的开创性论文。
这项突破性技术极大推动了对话式 AI 的进步,使人类能够更直接地参与 AI 模型的优化和提升。
据悉,在 Dario Amodei 任职期间,他和 Daniela Amodei 与其他高管之间发生了严重分歧,尤其是在项目领导权和安全问题上的争执。
2019 年初,一个看似普通的项目申请,成为日后产生分裂的导火索。
当时,Greg 正在主导开发一个能够玩在线对战游戏 Dota 2 的 AI 项目,随后希望加入负责语言生成 GPT 模型的 Dario Amodei 团队。
这一模型后来成为 ChatGPT 等成功产品的基础技术。
令人意外的是,Amodei 兄妹对 Greg 加入项目的请求直接给予了否决。他们向其他员工解释称,Greg 素有难以合作的名声,经常在未沟通的情况下随意修改代码。
随之,矛盾的升级程度令人震惊。一位前 OpenAI 员工透露,Amodei 兄妹在离职前几个月与 OpenAI 其他成员之间的关系越来越紧张。
Amodei 甚至创建了一个仅限特定研究人员参与的私密 Slack 讨论组,直接将 Altman、Greg 等公司高层排除在外。
这样的近乎决裂的行为,预示着团队分裂的不可避免。在今年 11 月的一期播客节目中,Dario Amodei 对这一经历进行了深刻的阐述。他坦言,最终的分道扬镳源于对 AI 安全开发的根本理念的不同。
他说:“如果你对实现目标有自己的理念,就应该去追求和实现它。试图说服别人改变他们的想法是极其低效的。”
最终,Amodei 兄妹选择离开 OpenAI,创立了 Anthropic。从此,Greg 也加入了 GPT 项目的开发。
Information 对所有离开 OpenAI 加入 Anthropic 的成员进行了统计,其中包括一些高级联合创始人、安全项目负责人,以及普通研究员。不算 Amodei 兄妹,两人外,还有 8 位 OpenAI 员工纷纷叛逃。
商业王牌:不炫技,只求专注
自2021年成立以来,Anthropic 花费了两年的时间才逐渐被外界关注。
其发展重点与 OpenAI 存在微妙差异,这也在一定程度上解释了为何 Anthropic 能稳步推动商业客户市场的发展。
借助于提前发布并广受欢迎的 ChatGPT,获得用户青睐具有一定的先天优势。Claude 的使用量低于 ChatGPT 是情有可原,因此 Anthropic 将研究重点转向如何更有效地向企业客户和开发者推广 Claude 模型。
与 OpenAI 追求多模态与复杂推理模型不同,Anthropic 把目标锁定在一条相对稳健的道路上。在 Anthropic 领导层看来,“这些看似简单的功能,实际上却能够改变整个游戏规则。”
此外,Anthropic 的 Jensen 也指出,目前大多数企业正在致力于将 AI 技术整合到现有产品中,这需要更大的上下文功能等支持,这些看似不够华丽,却能带来实质的改变。
例如文本摘要、内容生成和智能客服等功能都属于此。此外,ChatGPT 用户对推理模型的低使用率,看起来也佐证了这一观察。
因此,可以看出,Anthropic 的战略非常明确,更多资源被投入到解决企业实际问题上。基于此,他们关注以下几个方面:
-
扩大上下文窗口,以便 AI 模型处理更大规模的信息以回答问题
-
确保模型能够连接外部工具,如数据库和应用程序接口
-
协助企业开发能够整合实时专有信息的应用程序
大模型之战,Claude 突围
事实证明,这种务实的策略拥有巨大的市场潜力。
例如云协作初创公司 Airtable、法律研究公司 LexisNexis 等重磅客户,已开始大规模采用 Claude。
Airtable 首席执行官 Howie Liu 表示,Claude 扩大的上下文窗口使员工能够上传完整的销售通话记录,AI 模型能够更准确地捕捉对话中的微妙语气和客户投诉等细节。
更有意思的是,Liu 认为 Claude 的回应相较于其他 LLM 更显得“人性化”。这种微妙的差异,可能就是企业级应用中的胜利关键。
而且,他还提到,Airtable 之前也测试过 OpenAI 的模型,并在其他场景中继续使用这些模型。
在法律领域中,LexisNexis 也是一个重要客户。
其首席技术官 Jeff Reihl 表示,约 60% 的 AI 功能均采用 Claude,主要用于法律文件的起草和分析。
同样,Claude 扩大的上下文窗口在其中发挥了关键作用。他还补充道,其余功能则采用 OpenAI 的 GPT-4 和 Mistral AI 等开源模型。
此外,最引人注意的案例来自客服公司 Intercom。
2023 年 10 月,Intercom 宣布将其客服工单处理 AI 聊天机器人 Fin 的底层技术,从 OpenAI 大模型切换为 Claude。
数据显示,Claude 在无须额外调整模型的情况下,使客服工单的自动解决率提升到 51%。
相比之下,2023 年 3 月使用 OpenAI 模型驱动的 Fin 的工单解决率仅为 23%。
这一显著提升不仅可能源于模型的替换,也受到其他因素影响。然而,对于追求效率的企业而言,这无疑是一个振奋人心的突破。
值得一提的是,Anthropic 也宣布将使用 Fin 作为其客户服务 AI 智能体。
编程一手遮天,最火的 Cursor 加入
另外,在编码自动化方面,Anthropic 相较于 OpenAI 拥有显著优势。
今年夏天,Anthropic 悄然提交了一份引发业界惊叹的成绩单。随着 Claude 3.5 Sonnet 的发布,该公司在代码自动化领域迅速跻身顶级行列。
一名编程辅助工具初创公司 Augment 的首席执行官 Scott Dietzen 毫不掩饰地表示,在 2023 年夏季之前,他们仅依赖开源模型进行产品开发。
据他们透露,Claude 3.5 Sonnet 发布后,性能超过了包括 OpenAI 在内的所有模型,尤其是在需要深度理解和复杂推理的场景中,这一优势尤为明显。
另一家代码辅助工具公司 Sourcegraph 也将 Claude 3.5 Sonnet 纳为其默认模型。
他们的数据更加直观:用户 66% 的时间偏好使用 Anthropic 的模型,而不是其他的 OpenAI、谷歌等产品。
而且,在 GitHub 年度大会上,OpenAI 的重要合作伙伴微软也宣布在 GitHub Copilot 编程助手中加入 Claude 和 Gemini 模型。
不常在公开场合谈论竞争对手的 Altman,最近在一个月前的活动中承认:“毫无疑问,他们(Anthropic)开发出了一个在编程领域表现卓越的模型,这项工作令人印象深刻。”
剑拔弩张,Anthropic 反击时刻
近期的种种迹象表明,Anthropic 已开始主动攻击 OpenAI。
公司的销售团队规模较去年同期激增 500%。与此同时,销售团队的市场推广策略也发生了重大变化。
这背后,是 Anthropic 精心策划的一场市场反击。据一位内部人士透露,今年年初,Anthropic 的销售团队表现相对低调。
他们坦诚告知客户,大多数开发者仍在使用 OpenAI 等竞争对手的模型,并仅强调 Claude 在定制化模型开发等特定场景中的成本和性能优势。
然而到了 6 月,随着新版 Claude 模型的发布,公司的销售策略变得愈加明显。销售团队主动出击,强调 Claude 在年内的多次技术迭代中已超越 OpenAI,并着重展示其在多个权威 AI 基准测试中的优异成绩。
此外,他们还获得了业内众多知名人士和开发者的认可。
Perplexity 的首席执行官 Aravind Srinivas 的评价尤为精彩,他认为:“Claude 3.5 Sonnet 是一次重大突破,这不仅对 Perplexity 非常重要,对于整个市场的众多产品都产生了深远影响。”
更进一步,Srinivas 强调:“这个模型在逻辑推理能力方面实现了质的飞跃。”
虽然 Claude 3.5 超大杯何时上市尚无定论,但 Anthropic 正在用技术实力不断拓展突破的边界。
他们的目标是追赶 OpenAI,成为下一个 OpenAI。
参考资料:
-
https://www.theinformation.com/articles/how-anthropic-got-inside-openais-head?rc=epv9gi
本文来自微信公众号:新智元(ID:AI_era)