2024年12月18日,在第二届具身智能产业发展论坛上,宁波均普人工智能与人形机器人研究院CTO沈天曜指出,具身智能机器人的工程化落地仍面临不少挑战,包括成本、大规模产品库存、软件算法等,大模型训练、数据采集和处理仍需突破。当前人形机器人的产品形态尚不成熟,需要根据具体需求进行优化,明确的需求是推动产品发展的关键。
得益于多年的技术及行业知识沉淀,均普机器人研究院致力于从制造业的真实需求出发,为合作伙伴界定产品特性,并提供巨量、多元的场景为企业的产品做落地验证,助力人形机器人在工业场景实现工程化落地。
均普人工智能与人形机器人研究院CTO
以下为演讲内容整理:
针对未来的发展趋势,社会各界普遍达成共识,即人形机器人或同类机器人产品在未来必将广泛融入我们的生产与日常生活之中。我们有理由相信,在未来,人形机器人在日常生活中的普及程度或将媲美汽车,成为每个家庭的标配。而在工业领域,它们则相当于工业机器人,成为生产线上的必备元素。
然而,我们距离这一目标的实现尚有较大差距,在实际的工程化应用过程中存在着诸多挑战与问题。对于这些问题的解决,关键在于需要有主体去积极行动,推动问题的解决。均胜集团希望能够参与到这一历史进程之中,贡献力量。从技术层面而言,功能更为泛化、更贴近日常生活需求的人形机器人在技术上实现难度更大。
无论从大模型的构建这样的软件角度,还是从机器人的灵活性、稳定性这样的硬件角度看,人形机器人均面临着较多挑战。特别是在短期内,大多数专注于人形机器人本体研发的企业都面临着突破的焦虑。在投入数百亿资金后,投资者期望能够迅速看到成果。然而,这种期望显然是不切实际的。目前来看,我们认为工业应用场景是一个非常好的商业化渠道。
均普智能擅长在工厂环境中开展业务,在工业生产以及产线管理领域都具备丰富经验。我们特别关注人形机器人这一领域,并为此成立了专门的研究院。另外,均胜集团本身就是一个全球化布局的企业,在全球多地拥有研发中心和生产基地。集团在汽车行业深耕多年,我们相信,在汽车行业积累的knowhow经验能够复制并被融合到人形机器人的研发中。
图源:演讲嘉宾素材
人形机器人与具身智能在工厂中的定位不是工业机器人的替代者,而是替代部分简单、重复、机械的人类劳动。人形机器人的使用符合现代工厂的智能化演进趋势,鉴于此,我们坚信,依托均胜集团的全球化布局,我们的机器人产品有大量的落地场景,多样化场景带来的明确需求也将推动工程化落地。
我们并非直接生产产品,而是致力于为工厂提供稳定、高效、柔性化智能制造装备和产线,实现快节拍、数字化、可追溯等生产功能。例如,当客户需要构建一条自动化产线时,我们会综合考虑产线的节拍、日出货量以及场地条件等因素,为其设计并交付一条完整的定制化产线。在这个背景下,我们希望将这种高关节自由度、高柔性的人性机器人与定制化产线整合,为海外客户提供的不仅仅是产线级、车间级的生产装备,而是工厂级智能制造解决方案。
汽车产业具有产业链长、高度集成化的特点,是历次科技革命和产业革命的先导产业,正在向智能制造转型升级。传统产线虽然能够满足一定的生产需求,但在柔性方面存在局限。相比之下,通过引入人形机器人或具身体机器人,我们能够实现超高柔性与自动化的生产线调整。这不仅顺应汽车制造业的全球趋势与未来方向,也十分契合客户们对于安全稳定、高效节能、智能升级的战略准备。
为了使产品快速与应用场景融合,我们需要对应用场景进行细分。以垂直场景为基准来收集所需要的数据,从而大幅度降低数据采集的样本量。比如实现游戏机器人的全面能力可能需要收集百亿级的数据。在特定的垂直场景中,可能仅需一千万个数据样本即可满足需求。那么,这一千万个数据样本又该如何获取呢?
比如安排50名工作人员,每人每天工作12小时,每月工作28天,以此计算,50人一个月可采集约100万条数据。我们将这些采集到的数据进行整合和处理,构建出一个经过充分训练的大模型。该模型能够应对10至15种不同的工况,并具备一定的自主学习和迁移能力,从而实现快速部署。一旦实现这一目标,我们就能够真正将具身智能融入到我们的产线之中,显著提高生产效率和灵活性。
当前社会对具身智能的期望与产业实际发展水平之间存在显著的差距。如果人形机器人无法满足全社会对机器人概念的普遍期待,那么这一领域将难以形成具有广泛影响力的产业。我们认为,人形机器人最大的挑战并不在于其硬件方面,而在于大模型的构建、垂类大模型的应用以及数据采集等方面。
为此,我们致力于基于多样化的产品形态,在汽车电子、工业自动化等领域,为人形机器人的主机厂及高校机构提供一系列应用平台,以支持数据采集、场景构建与需求明确。我们与众多供应商建立了紧密的合作关系,并携手高校与研究机构,将他们的先进技术在我们的工程环境中进行实际验证。通过这一系列的合作与验证,我们不仅能够高效、高质量地采集和处理数据,还能够构建高精度、高适应性的AI模型,确保机器人在复杂环境中能够高效工作。
此外,我们针对特定垂直领域,进行深度优化,提高机器人在具体应用场景中的性能表现水平。通过多轮验证与优化,我们将进一步推动技术的功能化与产品化,确保相关技术符合行业规范,并最终实现市场推广。我们相信这一系列的努力,将有助于提高人形机器人的实际应用能力,助力整个产业快速发展。
目前,人形机器人还有很多技术难点尚未完全攻克,存在诸如软件端无法适应复杂的应用场景、交互能力差等问题。因此,在感知系统的开发上,我们会更加明确其性能需求、适用场景、集成芯片设计等,使其更好同具身智能相结合。
在数据采集方面,我们认识到真实的工程场景数据对于提升机器人性能至关重要。尽管网络数据量庞大,但其准确性难以保证;虚拟仿真数据虽然可以大量生成,但与实际场景相比,准确性仍有差距。在工程实践中,我们发现许多在仿真环境中表现出色的技术,但在应用于实际场景时仍会遇到各种问题。因此,我们计划在自己的厂区及合作伙伴的场所搭建专门的数据工厂,专注于数据采集和真实的工程实际数据检测。通过这种方式,我们可以获得更准确、更符合实际应用需求的数据,从而进一步优化人形机器人的性能,增加其灵活性和可靠性。
在开发与合作进程中,我们遇到了许多挑战:具身机器人配备了大量的传感设备,智能的实现离不开感知能力。然而,目前我们观察到的一个现象是,许多专注于具身机器人整机开发的公司,其实际行为更接近于构建一个展示技术实力的平台,而非开发一个实用的产品。他们倾向于将最强大、最优质、最昂贵的组件集成到系统中,例如追求极高的处理器性能,以及过度堆砌激光雷达等传感器。
这种开发模式并不符合工程化产品的开发原则,它更像是一种技术展示。究其原因,主要在于需求的模糊性。如果我们面向的是C端市场,开发的是消费电子类产品,那么需求在一定程度上是可以被引导和创造的。例如30年前,人们从未设想手机需要具备拍照功能,但如今,拍照已成为手机的标配功能,这一需求是被创造出来的。但在工业界,需求的产生则遵循着截然不同的逻辑——先有需求,后有产品。当人力无法搬动沉重的工件时,机械臂应运而生;当人工操作速度无法满足生产需求时,自动化产线成为解决方案。
图源:演讲嘉宾素材
在计算智能领域,由于应用场景的模糊性,当前计算机的连接方式与器件产品的开发并未严格遵循需求导向。我们致力于协助那些拥有强大技术实力的科技公司,清晰地界定他们所需的机器人产品类型。例如,在简单的工作环境中,可能无需激光雷达,仅依靠双目摄像头便足以满足需求。针对双目摄像头的应用,我们需要细致考虑其精度要求、采集频率、物理形态、安装位置以及快速拆装机制等关键要素。这些问题均属于零部件设计与优化的范畴,正是我们公司当前全力解决的核心问题之一。
这些细节和功能化的要求虽然琐碎,但我们坚信这些问题的解决将有助于行业实现进一步发展。
此外,在关节部件的研发上,我们也进行了深入探索。最近,我们进行了一项实验,为某款机器人的下肢配备了三箱可乐作为负载,并让它在厂区内进行两个半小时的持续奔跑测试,直至电池耗尽。在测试过程中,我们发现,机器人左侧臀部的温度仅为三十多度,而右侧则高达六十多度。
若此类问题出现在一款工业产品上,是绝对无法被接受的,这样的产品也无法推向市场。不过,在机器人领域,由于技术尚处于早期发展阶段,这类问题在某种程度上是可以被容忍的。但从行业长远发展角度来看,这些问题是要被解决的。
针对这些问题,我们进行了深入排查与研究,找出其根源。目前,我们也观察到了大量人形机器人产品在结构设计上存在诸多不足。这反映出许多科技公司,尤其是那些缺乏机械工程和电路硬件背景的科技公司,在产品开发上所面临的困境。
此外,在智能产品的信号传输方面,行业整体缺乏统一性和规范性,如一个主控电脑上可能同时通过USB、CAN总线、Wi-Fi、蓝牙等多种不同的通信方式接入的设备。
设备管理层面也存在一些问题,如我们难以准确掌握设备的上线与下线状态,有时缺乏设备状态反馈,这些问题迫切需要我们构建一套有效的设备状态呈现系统。为此,我们必须将产品集成到总线上,通过总线通信的方式实现设备间的互联与数据交换,这才是符合工程化要求的解决方案。
此外,我们需要探索一种合适的硬件芯片集成方案,推动具身智能接口的标准化发展。我们的目标是使这些产品能够像显卡一样,实现即插即用,从而助力科技公司或整机公司提高在算法领域的研发效率。
我们认为,工业化的垂直大模型是未来发展的重要方向。目前,我们已经着手开展多个具体场景的应用实践,旨在构建工业化的产业大模型。我们相信,这些大模型将真正具备改变主观性的潜力,极大提高生产力水平。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。