Loading...

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

GoodNav 12 月 30 日报道,智元机器人今日宣布推出全球首个基于全面真实场景、全能硬件平台及全程质量监管的百万真机数据集开源项目 AgiBot World

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

智元机器人表示:“这是一个具有里程碑意义的开源项目,标志着具身智能领域的‘ImageNet 时刻’已经来临。”

据悉,智元机器人将分批次在 HuggingFace、Github 以及 agibot-world.com 项目主页上上传数据,以下是相关链接:

  • HuggingFace:

https://huggingface.co/agibot-world

  • Github:

https://github.com/OpenDriveLab/agibot-world

  • 项目主页:

https://agibot-world.com/

智元机器人介绍称,AgiBot World 是全球首个基于全域真实场景、全能硬件平台与全程质量把控的百万真机数据集。与谷歌开源的 Open X-Embodiment 数据集相比,AgiBot World 的长程数据规模增加了 10 倍,场景覆盖广度扩大了 100 倍,数据质量从实验室级别提升至工业级标准

未来,智元机器人计划陆续开源千万仿真数据,以支持更广泛且更通用的大模型训练;将推出具身基座大模型以支持模型微调,并发布完整的工具链,以实现采集、训练和评估的闭环。

附官方介绍如下:

01、多样任务,十八般武艺样样精通

AgiBot World 数据集里的场景具有多样性和多元化的特征,从抓取、放置、推拉等基本操作到搅拌、折叠、熨烫等复杂动作,几乎覆盖人类日常生活的大多数场景。举例来说,其中一个视频展示了机器人如何在电脑主机中处理内存条,这需要毫米级的精细控制,任何小失误都可能损坏设备;其灵敏的末端触觉传感器如同神经纤维一样,帮助机器人实现了精确的对接。此外,还有展示机器人如何使用洗碗机的视频,其数据中展现了厨房水池内各种餐具的堆积,机器人准确地将杂乱的碗筷整理到洗碗机相应的卡槽,操作流程漫长且复杂。AgiBot World 数据集收录了超过 80 种日常生活中多样化的技能视频,使得机器人可以“样样精通”。

02、全域场景,上得厅堂下得厨房

AgiBot World 数据集源自智元自主建设的大规模数据采集工厂及应用实验基地,总面积超过 4000 平方米,内含 3000 多种真实物品,既为机器人的大规模数据训练提供了场所,又真实再现了家居、餐饮、工业、商超和办公五大核心场景,全面满足机器人在生产和生活中的典型应用需求。

全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment

家居场景真实再现了人类的户型布局,包括卧室、客厅、厨房和卫生间等,可以实现机器人的家务清洁、物品整理及厨房任务等。工业场景模拟了分拣和物流自动化,复刻工业仓库与生产线,包括分拣系统、打包设备和输送带等,能够完成物料分拣、包装和物流搬运等作业。通过多场景的高度复刻与任务设计,AgiBot World 为机器人研发与测试提供了实现具身智能的关键条件。

类似这样的真实场景在 AgiBot World 百万真机数据集中有 100 多种,其中家居占 40%、餐饮 20%、工业 20%、商超 10% 以及办公场景 10%。而且,80% 的任务都是长程任务,任务时长集中在 60秒到150秒之间,且包含多个原子技能,长程数据量是 DROID 和 OpenX-Embodiment 的 10 倍以上,3000 多种物品基本覆盖了这五大场景,并且数据还在不断丰富中。

图片

04、质量把控,严师出高徒

此外,数据集的质量是决定机器人能否高效学习的关键因素。AgiBot World 中的数据必须经过一套严谨的流程与验证链路。在项目伊始,我们就邀请了学术界、工业界、消费者等不同方的意见,不断迭代流程设计和规划;在数据采集质量环节中,无论是采集员还是采集质量,都由完善的管理体系和专业的团队全程保障;对采集到的数据本身,将通过端与云两侧进行严格筛选,自动剔除不符合要求的数据,之后专业审核员逐帧审核,以确保每一个动作符合任务标准;最后,这些数据还将通过算法再次验证,确保数据质量的全方位保障。

图片

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...