神秘 AI 模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
神秘的文生图模型“red_panda” (小熊猫)一夜之间火遍网络!!
它迅速攀升至文生图领域的顶端,直接超越了 Flux、Midjourney 等众多顶尖模型 ——
其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率达到 79%,每 7 秒就能生成一张图像。生成效果如下:
这到底意味着什么呢?网友们表示,这就像是跳级!
这与从 Flux 1 Schnell 跃升至 Flux 1.1 Pro 的境况相仿
不仅性能强大,red_panda 的无人认领更引发了大家的猜测:
-
可能是传说中的 Midjourney V7 或中杯 Stable Diffusion 3.5,因为它的生成质量非常优秀;
-
也有可能是 OpenAI 的 DALL-E 4,因为在图片后缀中发现了 OpenAI 的相关信息;
-
或许是 Mistral AI 的新模型,基于在未公布的测试版中发现的类似名称“Pandragon”;
-
还有可能源自 Recraft 文生图模型,因为它们曾使用小熊猫战士作为默认矢量提示;
-
……
有网友甚至猜测这可能是中国厂商的作品。
看这名字和图标,隐隐透出浓浓中国风。
在众多猜测中,一位工程师被网友点名,调侃说:
@felix_red_panda,你是不是?
哈哈,谁让你的头像与名称如此相似呢~
竞技场实测效果
red_panda 到底有多强?量子位将进行实测。
需要注意的是,由于 red_panda 刚刚现身,目前只能在竞技场体验。
规则简单,用户只需在两个匿名模型之间选择更喜欢的图像即可。
现在展示下 red_panda 与其他模型的对比,直观看看表现。
第 1 关:SD 3 Medium(√) VS red_panda
A 3D render of an ancient artifact, intricately detailed and realistically textured, as if just unearthed.(一个古代文物的 3D 渲染图,细节错综复杂,纹理逼真,仿佛刚刚出土。)
第 3 关:red_panda VS Flux.1 [dev](√)
An image of a financial advisor discussing investment strategies with a young couple in a modern office, emphasizing financial planning and long-term wealth management.(一张图片,展示了一位金融顾问在现代办公室里与一对年轻夫妇讨论投资策略,强调财务规划和长期财富管理。)
第 4 关:red_panda(√) VS neptune_next
Antarctic cruise ship poster.(南极游轮海报)
第 5 关:red_panda(√) VS Flux.1 [schnell]
A vintage, art nouveau-inspired perfume bottle with an elegant, curved design and an ornate, floral label reading “Essence of Elegance”, created as a 3D product render.(一个复古风格的、受新艺术运动启发的香水瓶,拥有优雅的曲线设计和装饰华丽的花卉标签,上面写着“优雅精华”,作为一个 3D 产品渲染图被创造出来。)
经过五局的对比,神秘模型 red_panda 并没有显示出令人意想不到的压倒性胜利。
但这也可能与个人审美有关:
感兴趣的朋友们不妨亲自去试试,看看能否随机匹配到 red_panda。(可以通过狗狗扩大样本量)
网友:中国造?
现在问题来了:red_panda 的来源是什么呢?
大多数人的第一反应都指向中国,原因很简单:一方面,这名字看起来就很有中国味,另一方面,中国目前在视频生成技术方面发展迅速,推出一个文生图模型也显得很正常。
几乎没有什么比这个名字更中国了……
提到快手、字节、Minimax 等企业,当你看到他们在 AI 视频领域的表现时,就会觉得这更有可能是来自一家在生成人工智能方面已具备丰富经验的中国公司。
除了国内的大型公司,另一种猜测是Midjourney V7。
Midjourney 于 8 月 1 日发布了 6.1 版本,并表示正在测试 V7,因此很多人怀疑 Midjourney 可能进行了秘密测试。(匿名竞技场测试模式显得很眼熟)
还有人认为可能是中杯 Stable Diffusion 3.5,这是 Stability AI 最近发布的一个型号,拥有 25 亿个参数,采用改进的 MMDiT-X 架构和训练方法,能够生成分辨率在 0.25~2 百万像素之间的图像。
难道这是为了换个名字来测试一下市场?
此外,还有来自 Anthropic 前员工的较为靠谱的猜测,“DALL-E 4 = Red Panda”。
他提供的证据显示,一张由 DALL-E 生成的图片包含了相关信息字符串。
不过也有网友反驳,认为 panda 也是因索引原因随机出现的?
还有人表示,OpenAI 并不需要再推出 DALL-E,GPt-4o 已经足够好,并且其命名风格也与 OpenAI 不符~
除了 OpenAI,法国开源模型公司 Mistral AI 也被提到,但这个说法比较牵强,仅仅是因为名称上有相似之处。
本月初,有消息称该公司正在测试新模型“Pandragon”,该模型可能具备图像生成和网络搜索功能。
因此,这个还未发布的测试模型也可能是来源之一~
但是当时的消息也提到,Pandragon 的图像生成功能可能会得到黑森林实验室的 Flux 提供支持。
这也引出了“red_panda”或许源自 Flux 的说法:
如果这是事实,那意味着自我竞争了呢?(doge)
截止到发稿前,虽然 red_panda 仍然维持领先,但它与后续选手的差距似乎在逐渐缩小。
让我们继续关注,期待未来的更多消息。
竞技场地址:
https://artificialanalysis.ai/text-to-image/arena?tab=Leaderboard
参考链接:
-
[1]https://x.com/deedydas/status/1850680875832496577
-
[2]https://x.com/ArtificialAnlys/status/1850587843837771900
-
[3]https://www.testingcatalog.com/mistral-ai-prepares-to-release-new-pandragon-model-with-advanced-features/
本文来自微信公众号:量子位(ID:QbitAI),作者:一水,原标题《神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney,网友:一看就中国的》