Loading...

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

GoodNav 11 月 5 日报道,腾讯混元今天推出了 Hunyuan3D-1.0 大模型,官方称其为首款同时支持文本生成与图像生成的 3D 开源大模型

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

▲ 文生模型

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

▲ 图生模型

该模型采用两阶段的生成策略,官方表示在确保质量和可控性的前提下,仅需 10 秒便可生成 3D 资产

  • 首先,团队使用了一种多视角扩散模型,轻量版模型大约能在 4 秒内生成多视角图像。这些图像从多个角度捕获了 3D 资产的丰富纹理和几何信息,将任务从单视角重建扩展到多视角重建。

  • 接着,团队引入了一种前馈重建模型,利用第一阶段生成的多角度图像。该模型能在约 3 秒内快速且准确地重建 3D 资产。重建模型学习处理多视角扩散所带来的噪声与不一致性,并利用条件图像中的信息高效恢复 3D 结构。

  • 最终,该模型能够对任何单视角输入进行三维生成。

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

官方表示,该模型在泛化能力和可控性方面表现出色,能够重建各种尺度的物体,从大型建筑到小型工具与花草。

腾讯混元开源 Hunyuan3D-1.0:首个同时支持文生和图生的 3D 开源大模型

相关链接如下:

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...