在机器人技术前沿,美国初创企业Figure AI近期推出了名为Helix的端侧大模型,这一创新标志着人形机器人控制技术的重大飞跃。Helix是全球首个能够对整个人形机器人的上半身——包括头部、躯干、手腕及手指——实施高频率、连续视觉-语言-动作(VLA)控制的模型。这意味着,机器人无需经过大量训练,便能直接响应自然语言指令执行任务。
Figure AI通过构建两个互补系统来平衡视觉语言模型的通用性与速度。第一个系统是一个快速反应的视觉运动策略模型,每秒可执行200次精确动作;第二个系统则是一个开源的视觉语言模型,能理解复杂场景和自然语言。这两个系统通过端到端训练实现了高效沟通,有效克服了传统人形机器人在执行多样化任务时的限制。
此外,Helix不仅能在单一机器人上运行,更是全球首个支持双机协作的AI模型。在演示中,两台装备Helix的机器人面对未知杂物的挑战,成功实现了协作分类。为了完成任务,机器人需要进行视觉确认,相互对视以确保信息传递准确无误。这种人机协作方式不仅展现了Helix的强大功能,也预示着未来人形机器人与人类间的互动将更加自然高效。
通过仅500小时的高质量监督数据,Helix便能轻松识别并处理数千种小型家居物品。在简单指令下,机器人能够准确完成未曾示范过的任务,显示出其卓越的灵活性和智能化水平。
随着Helix的问世,Figure AI也在积极寻求融资,目标金额高达15亿美元,预计公司估值将达到395亿美元。这一数字相较于去年增长了近14倍,充分反映了市场对机器人技术的浓厚兴趣及其巨大潜力。
在机器人技术领域,美国创业公司Figure AI近期推出了名为Helix的端侧大模型,这一创新标志着人形机器人控制技术的重大飞跃。Helix是全球首个能够对整个人形机器人的上半身——包括头部、躯干、手腕及手指——实施高频率、连续视觉-语言-动作(VLA)控制的模型。这意味着,机器人无需经过大量训练,便能直接响应自然语言指令执行任务。
Figure AI通过构建两个互补系统来平衡视觉语言模型的通用性与速度。第一个系统是一个快速反应的视觉运动策略模型,每秒可执行200次精确动作;第二个系统则是一个开源的视觉语言模型,能理解复杂场景和自然语言。这两个系统通过端到端训练实现了高效沟通,有效克服了传统人形机器人在执行多样化任务时的限制。
此外,Helix不仅能在单一机器人上运行,更是全球首个支持双机协作的AI模型。在演示中,两台装备Helix的机器人面对未知杂物的挑战,成功实现了协作分类。为了完成任务,机器人需要进行视觉确认,相互对视以确保信息传递准确无误。这种人机协作方式不仅展现了Helix的强大功能,也预示着未来人形机器人与人类间的互动将更加自然高效。
通过仅500小时的高质量监督数据,Helix便能轻松识别并处理数千种小型家居物品。在简单指令下,机器人能够准确完成未曾示范过的任务,显示出其卓越的灵活性和智能化水平。
随着Helix的问世,Figure AI也在积极寻求融资,目标金额高达15亿美元,预计公司估值将达到395亿美元。这一数字相较于去年增长了近14倍,充分反映了市场对机器人技术的浓厚兴趣及其巨大潜力。
暂无评论