界面新闻记者 |
界面新闻编辑 | 文姝琪
如果让人类在工厂中学会一项精密装配技能,需要多久?机器人的答案是10分钟。只需要10分钟,智元让机器人在真实产线“学会技能并稳定上岗”。
11月3日,界面新闻记者从智元机器人获悉,其研发的真机强化学习技术已在与全球智能产品ODM企业龙旗科技合作的验证产线中落地。
智元机器人合伙人兼首席科学家罗剑岚在接受界面新闻等媒体采访时表示,这次突破的核心在于性能,目标是在工厂标准下把AI模型真正部署起来,实现工业级稳定性与“100%任务完成率”,并在约十分钟内完成新技能训练与稳定部署。
根据智元官方的介绍,这标志着真机强化学习技术首次从学术论文走向工业应用,为消费电子等精密制造领域带来“即插即用”的智能升级方案。
界面新闻获悉,今年10月9日,智元与龙旗就工业场景的具身智能机器人应用开展合作,龙旗科技下达数亿元金额的智元精灵G2机器人框架订单。据智元透露,此次合作共将部署近千台机器人,是目前国内工业具身智能机器人领域最大订单之一。
长期以来,精密制造产线一直面临刚性瓶颈。简单来说,传统机械臂需要复杂夹具和场地改造,调试周期长、换线成本高,即便采用“视觉+力控”等柔性方案,也存在参数敏感、部署复杂的问题,难以应对消费电子行业高频率的产品迭代。
《中国智能制造发展报告2023》调研显示,近70%的制造企业认为订单弹性、产品多样化导致生产效率下降,传统自动化难以充分应对变化。
针对这一痛点,智元推出了真机强化学习方案。界面新闻从智元获悉,在该方案中,机器人可在真实产线中自主学习、持续优化作业策略,新技能训练与稳定部署仅需数十分钟,且性能全程不降级。在换线、换型或流线调整时,这个系统只需最小的硬件改动和标准化部署流程,即可显著提升柔性、压缩部署时间与成本。
根据罗剑岚的解读,这一技术主要有三方面优势:首先是极速部署,训练周期可从数周减至数十分钟;其次是高适配,官方表示其在长周期运行中持续保持工业级稳定性与100%任务完成率;最后是柔性换型,其任务变更仅需快速再训练,无需定制夹具或复杂工装,即可适配不同产品与工序。
智元官方表示,这意味着机器人感知决策层与运动控制层实现了高效协同,标志着具身智能机器人在“算法智能”与“执行智能”的一体化融合上迈出了关键一步。更重要的是,这并非实验室演示,而是在准生产条件下的真实部署,意味着智元机器人率先实现了从前沿算法研究到工业级验证的落地。
罗剑岚在采访中透露了更多的技术细节。他表示,“团队通过预训练模型结合少量示范和纠错,快速点亮策略,并在工业给定范围内微调参数,从而实现了‘十分钟学会’新技能。”
“对于换工位、夹具偏差等小幅变化,系统几乎无需新增样本即可适应;对于幅度较大的变更,则通过持续学习和自校准在十几分钟到三十分钟内完成迁移。”他还透露,公司正在构建工厂内部的数据闭环机制,以实现在不同工序间的泛化应用。
在被问及技术突破点时,罗剑岚强调核心在于性能,要将AI模型真正部署到工厂中,实现百分之百的准确率,“所有人都能做,与真正做到100%准确率是完全不同的两件事。”
按照他的说法,智元的关键技术是真机强化学习,即机器人在实际产线上通过与环境交互自动优化策略,以满足工业生产中对稳定性、成功率和效率的极致要求。
罗剑岚介绍,目前该技术已经处于接近常态化作业的部署状态,覆盖的任务主要集中在一个工位的准生产测试产线上,并将扩展到多个工序和工位的应用。他表示,目前约有80%的任务属于上下料这类传统自动化难以完成、需要柔性换线的工序。
他还提到,当前测试线已极其精密,例如已经应用的FCT(功能测试)工位用于iPad等产品的电检,精度达到毫米级。罗剑岚透露,后续智元计划与龙旗共同验证更多工序,包括整线级别的应用推广。
合作伙伴也对这一成果充满期待。龙旗科技董事长杜军红表示:“智元机器人的真机强化学习技术在精密制造复杂场景中展现出巨大潜力,为我们构建新一代AI智造体系、巩固行业竞争优势提供了重要支撑,我们我们对双方后续深化合作充满信心。”
“这是智元‘AI+机器人’战略的关键一步”,智元机器人董事长兼CEO邓泰华则称,“未来这些经过验证的智能技能将通过OTA方式实现标准化分发,进一步释放具身智能的产业化价值。”
界面新闻了解到,双方将基于这次成果持续推进技术迭代,推动真机强化学习在消费电子、汽车电子等更多精密制造场景的应用与复制,构建具身智能驱动的AI制造生态。
实际上,这一进展与行业趋势契合。IDC今年9月发布的《中国AI视觉工业机器人应用市场份额,2024:大小模型协同,迈向具身智能工业机器人》指出,具身智能工业机器人正成为重要发展方向,其以AI视觉为核心,通过多模态感知、环境理解和自主决策,推动工业机器人从单纯执行向“感知-学习-决策-执行”闭环转变,从而适应复杂工业环境并提升柔性生产能力。
智元这次落地成果,正是契合了制造业对智能柔性自动化的需求,随着具身智能技术的进一步成熟和推广,制造业的生产方式或将发生革命性变化。
正如罗剑岚所设想,“理想的具身智能产线可以用一条生产线满足12款、20款、甚至50款手机的生产需求,完全由数据驱动,能根据供需变化,仅通过调整奖励函数或指引信号,就自动完成适应过程。”

