稚晖君半年干出个人形机器人!有脑有手步伐稳健,上得实验室下得厨房,价格20万以内...

本文主要是介绍稚晖君半年干出个人形机器人!有脑有手步伐稳健,上得实验室下得厨房,价格20万以内...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,B站野生钢铁侠、天才少年稚晖君创业首秀,人形机器人惊艳亮相!

最新型号远征A1,首发就接入大模型

稚晖君一声邀请,反屈膝设计的它,小跑着稳步走上台:

ef5550dac113cc1ea9a057902bf6bbaa.gif

然后稳稳地站在舞台中央,和稚晖君贴贴:

286f82018c02d9cd66aecb1f2b3be390.gif

在录像演示里的远征看起来挺耐踹:

88c120e19bc06543366e35408572a551.gif

能做事儿,干些帮助汽车工厂检测外观啥的:

ae63d07e5f3640eb745a3767e2e290a1.gif

以公司智元CTO、首席架构师的身份,稚晖君表示,远征A1的未来计划,是可以在各种复杂场景下自主完成移动和操作任务”。

比如当管家,给家里打个鸡蛋:

b8d3383d53caf57fdda724a66cb36432.gif

或者进生物实验室无情地做实验:

21ff5b2c4273f7c09a4f0656ae550151.gif

稚晖君挺皮,举了个网络上流传的段子,并表示:

大家想让AI做的事,比如做饭、打扫房间,其实是软硬件结合的问题。

35688db9e30846efd691525a5dd91ec0.png

于是介绍道,智元团队对百亿级别的开源大模型进行了调优,形成WorkGPT,有先验知识,还带思维链的那种。

然后在基础上进行架构,将这个大模型的能力接入远征A1,使其具备理解人的指令,并对指令进行任务编排、执行闭环的能力

根据不同的应用场景,比如汽车总线或3C产品的装配,远征A1身上的大模型还会进行能力适配。

就像如果它进厂打工,到新能源汽车工厂装配底盘:

d3339cee7ed2bde2f601bd9daf75e96f.png

前一日的媒体沟通会上,智元就明确表示:

近段时间涌现出很多家人形机器人(公司)。硬件本体因为电驱形式受物理限制,已经到了一个瓶颈期。
今后真正的比拼,就是机器人是否更聪明,就是大模型的人工智能能力。

远征A1计划价格控制在20万元以内,明年下半年商业化落地。

第一个目标就是应用在工业制造领域(据悉已经在与国产头部汽车厂商和3C厂商等密切洽谈)。

随后才会逐步走向to C应用,做做烹饪炒菜、衣物整理以及失能老人护理/肢体恢复辅助等。

4cc44241748c46e28751fa26664abc4e.png

来具体看看远征A1的简历咋样——

大模型能力接入,能像乐高一样“拆拆乐”

远征A1,稚晖君和其创业团队花费半年时间打造的人形机器人。

身高175cm,体重53kg,全身49个自由度。

最高步速为7km/h,整机承重80kg,单臂最大负载5kg。

de332f5b9649b575baa6f37d46ad08ff.png

远征A1是远征系列的“头号玩家”,这个系列的目标是融入生产场景并发挥作用。

稚晖君在现场介绍了这名自家新员工的核心组件和技术指标——

1、核心关节电机PowerFlow:自研;峰值扭矩超过350NM,重量为1.6KG。

使用了准直驱关节方案,实现低齿槽转矩设计,搭配10速比以内的高力矩透明度行星减速器、共轭同轴双编码器、一体液冷循环散热系统,以及自研的矢量控制驱动器。

7696ebca477e38b27e0e80ce71ae56f3.png一体液冷循环散热系统

2、灵巧手SkillHand:12 个主动自由度和5个被动自由度。

所有驱动内置,并集成了基于视觉和触觉的指尖传感器,专门面向精密操作。

今后将进一步迭代,成为远征系列的标准配件。

58750892bb6fdca60e0c237ed8ac812c.png

3、统一软件框架AgiROS:机器人运行时的中间件系统,智元自研,后续将开源,提供demo和详细文档。

AgiROS的原则是轻量、易用、高性能、高扩展性,遵循现代开发范式,提供多种语言的接口,以插件形式兼容ROS、ROS2等机器人开发生态,以及GRPC、HTTP等云服务生态。

8ccfc387d81bbcba8e2c9674609ea11a.gif

4、语言任务模型WorkGPT:结合LLM和VLM等AI技术。

基于百亿开源模型调优,多模态,为机器人提供自主感知环境、理解任务、编排动作的能力,并且实现了思维链。

df523a1f0d08b6d1c3cb2eacdff5df4a.png

5、具身智脑E-Brain

把机器人的思维系统分为云端的超脑,端侧的大脑、小脑,以及脑干这四层,分别对应机器人任务级、技能级、指令级以及伺服级的能力。

并且基于任务数据反馈,让机器人在任务执行过程中不断进行强化学习。

c36dec62f55ed5728c570ce82521ba9b.png

近期国内人形机器人产品大爆发,这几日的世界机器人大会上百花齐放不说,有的人形机器人凭借踹都踹不倒的本领,让OpenAI联创都直言想要。

除了“稚晖君”这个IP的加持,智元的机器人还有些啥亮点?

量子位在现场的感受是:这真的好像一个接入了大模型的乐高大玩具。

首先,是它接入大模型能力,有自己的脑子19323e1cea4e54a8f7726a040e7905a6.png

此前的预告海报上,稚晖君团队已经打出了“具身智能”的字眼。

对这四个字最简单的理解,就是早前的机器人是基于固定轨迹,通过多种试校方式来实现。

但具身智能不是固定轨迹,在整个过程中,以具体任务为导向自我决策,根据当前的状态来进行下一步的轨迹规划,然后运动。

为了实现这个目标,团队最重要的一项工作就是对百亿参数的开源大模型调优,然后接入机器人,“通过多模态算法实现身体与智能的融合”。

如此一来,这个人形机器人就拥有了大脑,能够完成包括视觉感知、语音识别、任务规划和运动控制等方面在内的任务。

a685adffae821d081e3aecf5b6f2bdb0.png

其次,它进行了上下肢分体的模块化设计,能像乐高一样拆了拼,拼了拆。

先说其上肢,支持灵活更换末端工具,从而满足多种任务的要求。

再说起下肢,能够换成双足、轮式、轮足等各种不同的设计。

拆拆装装,就能达到不同应用场景下,最优的机器人配置和扩展。

73b144fedbbd8d0ef44120de05473447.gif

智元目前的打算是,会在未来逐步开放开发平台,通过开放协同模式、平台接口与能力、工具和云平台。

谁是稚晖君

稚晖君,本名彭志辉

他在电子科技大学拿下本硕学位。不过本科时,他的专业是生物医学工程,因为一直自学计算机知识,研究生顺利转向信息与通信系统专业。

c6b171c7eafb873b7164e8c23206e5ec.png

2018年毕业后,他的第一站是OPPO研究院,面试时一口气拿下硬件岗和算法岗的两个Offer。

但他最后选择了成为AI算法工程师。

2020年,稚晖君加入“华为天才少年计划”,加入华为计算产品线昇腾——这个部门主要是打造面向“端、边、云”的全场景AI基础设施方案。

华为给他的对外title是昇腾AI边缘计算专家。

加入华为的次年,任正非在演讲中表扬了他,称其是华为创新的动力

去年12月底,加入华为两年后,华为员工在线爆料华为内部已经搜不到稚晖君的工号,恐已离职。

301c65af451e236c6301f649e47662d4.png

随后,稚晖君正面回应:

传言不虚,细节不表,接下来我会开启一段新的事业,去做更有挑战的事情

2023年2月,其作为联合创始人之一智元机器人成立,他在其中担任CTO和首席架构师一角。

同为创始人的,还有上海人工智能研究院智慧康养首席科学家、上海交通大学机械与动力工程学院教授闫维新

他在康复机器人领域有所研究,并且研发中餐烹饪机器人有近16年历史,研发出60款以上餐饮服务类机器人。去年北京冬奥会纯·机器人炒菜、上菜的智慧餐厅,就由他主导参与。

23843d74ff622090db92478214f1bd53.png

说了那么多他的职业履历,但大家熟悉的稚晖君的身份,应该是B站科技区拥有近250万粉丝的知名UP主。

2021年,他曾拿下“年度百大UP主”称号。

据他自己说,最初只是把B站当做视频存储服务器,没想到却收获了一批稳定的粉丝,于是开始转型做up主。

不过半年,稚晖君火了,还因为过于硬核的视频内容被被网友们戏称为“野生钢铁侠”、“栈溢出”工程师。

其中最为出圈的几条,包括“钢铁侠机械臂”“自动驾驶自行车”“小电视”等,播放量都在300万+。

28b26b28b1a203a9b1df29c327fe0e57.png

可以看到,他在B站上更新的内容大都和机器人相关

毕竟他曾经公开表示过对机器人领域的热爱,称最喜欢的还是智能交互和机电控制类的项目,说大点就是和机器人相关的

现在创业干的事儿,也聚焦在了机器人赛道,还是最近大热的具身智能。

今年4月时,稚晖君放出自制双足机器人哪吒的视频中就透露,在通用机器人和AI领域LLM结合上,今年晚些时候还会有一些动作。

上月底,更是放出了一段基于大模型的机器人行为自动编排和任务执行的视频:

e886c93cf878c5de029fa4d2e351804d.gif

这次发布会,B站直播间的粉丝们也打出了满屏的弹幕称赞。‍‍‍‍‍

42c9df667779c54ada96631e43c6c60c.png

如今不仅人形机器人新产品对外亮相,听闻公司层面进展也十分顺利,已经完成了天使轮、A轮、A1 轮、A1+轮共4轮融资。

从一个自称“野生钢铁侠”的B站up主,到成为N亿美元估值创业公司的CTO,真的做出了个“钢铁侠”,稚晖君花了3年的时间。

不瞒你说,就这位年轻人创业背后的更多故事,量子位特地和他聊了聊,也会整理出来与大家分享还帮大家催更了一下B站视频~

感兴趣的话不妨激情转发/在看,并关注接下来的更新(doge)

20c25e72486c3da4918de9cd4f0b0370.png

— 联系作者 —

f4703856abcafa101aa0eaf5ed123a4d.png

「中国仿生机器人产业全景报告 · 量子位智库」下载

AGI 的火热发展为仿生机器人的实现补全了最后一块拼图,仿⽣机器⼈将在技术创新和商业模式上迎来新周期。量子位智库发布《中国仿生机器人产业全景报告》,扫描下方二维码即可查看并下载完整报告。

9月6日,我们将在北京举办仿生机器人行业沙龙,欢迎感兴趣的企业联系活动负责人王琳玉,联系方式见下方。

c54b61a256a67d10fd0aea93dec48a7b.png

点这里👇关注我,记得标星哦~

这篇关于稚晖君半年干出个人形机器人!有脑有手步伐稳健,上得实验室下得厨房,价格20万以内...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/283449

相关文章

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

HomeBank:开源免费的个人财务管理软件

在个人财务管理领域,找到一个既免费又开源的解决方案并非易事。HomeBank 正是这样一个项目,它不仅提供了强大的功能,还拥有一个活跃的社区,不断推动其发展和完善。 开源免费:HomeBank 是一个完全开源的项目,用户可以自由地使用、修改和分发。用户友好的界面:提供直观的图形用户界面,使得非技术用户也能轻松上手。数据导入支持:支持从 Quicken、Microsoft Money

【JavaScript】LeetCode:16-20

文章目录 16 无重复字符的最长字串17 找到字符串中所有字母异位词18 和为K的子数组19 滑动窗口最大值20 最小覆盖字串 16 无重复字符的最长字串 滑动窗口 + 哈希表这里用哈希集合Set()实现。左指针i,右指针j,从头遍历数组,若j指针指向的元素不在set中,则加入该元素,否则更新结果res,删除集合中i指针指向的元素,进入下一轮循环。 /*** @param

分布式系统的个人理解小结

分布式系统:分的微小服务,以小而独立的业务为单位,形成子系统。 然后分布式系统中需要有统一的调用,形成大的聚合服务。 同时,微服务群,需要有交流(通讯,注册中心,同步,异步),有管理(监控,调度)。 对外服务,需要有控制的对外开发,安全网关。

Java IO 操作——个人理解

之前一直Java的IO操作一知半解。今天看到一个便文章觉得很有道理( 原文章),记录一下。 首先,理解Java的IO操作到底操作的什么内容,过程又是怎么样子。          数据来源的操作: 来源有文件,网络数据。使用File类和Sockets等。这里操作的是数据本身,1,0结构。    File file = new File("path");   字

STL经典案例(四)——实验室预约综合管理系统(项目涉及知识点很全面,内容有点多,耐心看完会有收获的!)

项目干货满满,内容有点过多,看起来可能会有点卡。系统提示读完超过俩小时,建议分多篇发布,我觉得分篇就不完整了,失去了这个项目的灵魂 一、需求分析 高校实验室预约管理系统包括三种不同身份:管理员、实验室教师、学生 管理员:给学生和实验室教师创建账号并分发 实验室教师:审核学生的预约申请 学生:申请使用实验室 高校实验室包括:超景深实验室(可容纳10人)、大数据实验室(可容纳20人)、物联网实验

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

LeetCode 第414场周赛个人题解

目录 Q1. 将日期转换为二进制表示 原题链接 思路分析 AC代码 Q2. 范围内整数的最大得分 原题链接 思路分析 AC代码 Q3. 到达数组末尾的最大得分 原题链接 思路分析 AC代码 Q4. 吃掉所有兵需要的最多移动次数 原题链接 思路分析 AC代码 Q1. 将日期转换为二进制表示 原题链接 Q1. 将日期转换为二进制表示 思路分析

半年高达552亿元,锁定云第一,中国电信天翼云紧追不舍

【科技明说 | 科技热点关注】 刚才我注意到中国电信公布2024年中期业绩,报告期内,中国电信实现营业收入为人民币2660亿元,同比增长2.8%,其中服务收入为人民币2462亿元,同比增长4.3%;净利润为人民币218亿元,同比增长8.2%。 其中亮点,2024年上半年,天翼云保持快速增长,收入达到了552亿元,同比增长20.4%,占服务收入比升至22.4%,市场头部地位进一步巩固。 为