投影上本来正展示着的公司先容PPT被切换成了京东的购买记载,页面上是一件蓝色衬衫,正是梅卡曼德机器东谈主首创东谈主兼CEO邵天兰此刻穿戴的这件。从2012年驱动,每当衬衫不够穿时,他就会找到兼并个历史订单再买几件一模一样的。只须衬衫不下架,邵天兰就会一直买兼并件。
这张购物订单,一方面像是邵天兰的自我考证:从穿戴、躯壳到梅卡曼德对外讲的故事,都和八年前初创业时没多大变化。“没打脸、没跑偏”,邵天兰行运,从2016年公司成立于今,一直走在正确的方进取。
另一方面,邵天兰认为男装和工业品的逻辑很像,天然率先门槛高、有辩论复杂、考证周期也长,郑重一个先发优势。但比及用户一认同,就会一直复购。这是ToB行业的公道——感性有辩论、分析,一朝标准化之后,拦阻易再变化。
2017年头,华创成本就独家领投了梅卡曼德的Pre-A轮融资。尽管当年展示给投资东谈主的PPT还能沿用,但发生在梅卡曼德这家公司身上的变化也可想而知:除了不停迭代机器东谈主3D视觉眼睛、AI大脑以外,基于对操作身手的累积,他们又作念出了五指灵巧手,不仅赋予了机器东谈主精确感知、智能有辩论和高效实践的身手,还让梅卡曼德的家具得以在汽车、物流、重工等繁密范畴跨行业、限度化落地,成为全球“AI+机器东谈主”范畴限度最大的独角兽企业。
作为首创东谈主,邵天兰当年几年每每自嘲,称我方是公司的“一号客服”、“最大的家具司理”,以及“创业狗”。因为梅卡曼德干事的行业瞭望是个万亿商场,近看是一万个一亿的商场。这其中最大的挑战不在于知足特定客户的特定需求,而是怎么高效地知足多如牛毛用户的各式需求。
是以,看似酷炫的具身智能机器东谈主背后,需要濒临的其实是多数马勃牛溲般的细节。而恰正是对这些细节的打磨,组成了梅卡曼德巨大的资产和壁垒,才让这家公司在冲向具深智能末端的过程中上了桌。
平日里,邵天兰心爱读企业家列传,看这些真确的创业公司,是如安在共鸣尚未酿成时就驱动举止。同期他也意志到,诸如乔布斯、马斯克这样的东谈主,禀赋异禀,常东谈主难以效法。但所幸具身智能这个行业,靠的从来不是少量数明智绝顶的东谈主,也莫得什么独门隐讳,这正是让邵天兰沦落的原因:“咱们莫得天才故事,只须一拳一拳打怪升级。”
口述:梅卡曼德机器东谈主首创东谈主兼CEO 邵天兰
采写整理:华创成本「创·问」剪辑部
不作念互异化竞争不久前,咱们参加了2025 WAIC 寰球东谈主工智能大会,几六合来,梅卡曼德成了全场最热点的展位之一,中午十二点半还东谈主头攒动,一直到赶走终末一刻都挤满了不雅众,众人都在围不雅机器东谈主是怎么叠衣服、怎么当“拣货员”、“售货员”的。
你别看叠衣服这样一件肤浅的小事,要作念好其实拦阻易。因为衣服是典型的柔性物体,需要机器东谈主我方能高效地实践长序列柔性复杂任务,它的双臂必须高精度协同,才能完成“取-叠-放”的经由。衣服因为太软了,机器东谈主还得学会趁风使舵,知谈哪个场地需要抚平褶皱。这可比我强多了,每次出差,我我方叠的衬衫都还七皱八褶。
“双臂机器东谈主海量物体分类”展示的是机器东谈主自主分拣海量恐怕物体的身手,咱们会在机器东谈主眼前放上玩物、零食、日化、生果等几十种物体,它们的材质、体式、大小尺寸都不一样,机器东谈主能我方合资识别标签,何况按照东谈主类发出的天然谈话教唆进行实时候类。比如我把芒果、茄子、雨伞摆在它眼前,它能凭证我的教唆辞别把物体放到生果、蔬菜、日用品的标签底下。这种泛化身手,今天还是可以知足工业、物流、电商、食物等各个范畴关于海量物体的高速分拣需求。
WAIC期间,东谈主形机器东谈主货架取货也很滋扰。不雅众在现场下单饮料后,机器东谈主就会我方走向货架,拿取之后再递给不雅众,它还能凭证货架的高度随时让我方“长高变矮”。这台实践任务的斯坦德东谈主形机器东谈主DARWIN平台,搭配的即是咱们梅卡曼德的具身智能“眼脑手”。
尽管咱们我方不作念机器东谈主实践,但可以适配市面上几十个品牌、上千个不同机器东谈主的型号,这背后即是基于梅卡曼德通用机器东谈主的自研本事栈:Mech-Eye 高精度 3D 相机、Mech-GPT 机器东谈主多模态大模子与 Mech-Hand 仿生五指灵巧手。
这是咱们第一次全景展示具身智能“眼脑手”全栈AI身手。看似对东谈主类来说不费吹灰之力的叠衣服、分拣货色手段,对机器东谈主来说,则需要越过塌实的AI本事基础。咱们的本事无间迭代,才能让机器东谈主掌合手这些重要身手。
梅卡曼德从成立地,作念的事情即是用AI和3D视觉等智能本事,让机器东谈主领有更高档的传感、感知、贪图等身手,用通用的家具去贬责广宽的需求。之是以要给机器东谈主装上“眼睛”,是因为东谈主的眼睛比较而言最具共性。比如我自己踢球踢得很差,但眼睛可以判断场上的情况;我也不会转笔,但眼睛可以判断出笔的体式。
工业范畴里触及的安装、切割、焊合等各式工艺,不管针对几十米长的船照旧几毫米的部件,从视觉层面操作都有共性——识别物体的种类、判断它的景色,精确地定位,然后相通机器东谈主完成相应的动作。
目下,咱们作念的高精度相机,最高还是可以达到 0.2 微米的精度。这是什么意见?把一根头发劈成 400 份,每一份差未几即是 0.2 微米。此外,梅卡曼德3D视觉眼睛还能顺应各式光照环境、物体材质和位置姿态等,哪怕物体反光、透明,也能高质地成像。
(梅卡曼德Mech-Eye高精度3D相机对办公用品生成的点云图)
因此,梅卡曼德这套机器东谈主“眼脑手”,不管是制造照旧物流,都能通用:既可以在汽车厂的焊装车间作念上料、码筐、焊合、质检等好多职责,同期也可以在奶粉厂、快递物流站作念搬运。咱们的客户也来自越过多的行业,大到几十米致使上百米长的汽船制造,也有几毫米的手机部件的坐褥。
目下,梅卡曼德十几个家具 SKU 就可以遮掩绝大部分使用场景,而至于东谈主工智能的算法,若是要为每一个场景去作念专门的开发老练考证,成本太高,是以最重要的部分,依然是要把大脑的部分共性化。
2024年7月,咱们推出了Mech-GPT机器东谈主多模态大模子,这是和咱们公司的首创本事参谋人张建伟院士共同合作开发的。Mech-GPT多模态大模子相称于给机器东谈主装上了智谋大脑,只需要和它进行天然谈话的对话,不需要什么复杂的编程和专科常识,机器东谈主就能听懂并实践东谈主类的口令。
Mech-GPT还能适配各式机器东谈主和器具,不单是局限在某一种硬件上,工业、物流、零卖、农业、活命、科研等等任何范畴,机器东谈主都能完成多种各种的复杂任务,这也大大裁减了机器东谈主的使用门槛。
在AI大脑+3D视觉的基础上,咱们又研发了灵巧手Mech-Hand,这个尺寸和咱们东谈主类手掌大小差未几,但比起传统的灵巧手,它体积更小、解放度更高、融会终了身手也更强。从精密电子器件到不规定物体,Mech-Hand都能抓取,而且它会凭证物体的大小体式,可以活泼休养需要用到几根手指。相通,Mech-Hand也不局限于“专机专用”,而是可以跨环境、跨任务去诓骗。
(梅卡曼德灵巧手Mech-Hand)
咱们把机器东谈主的“眼脑手”作念到迷漫标准化、通用化,再去遮掩千行百业,知足各式需求。优势在于一朝作念出来之后,就会有很强的限度效应和马太效应,家具的服从、全球化以及客户遮掩都会作念得很好。
不同于破钞品追求互异化,咱们干事的范畴濒临的都是最广宽的需乞降最客不雅标准的家具。我商议过那些工业范畴的巨头,他们简直都是作念主流商场。
是以打从创业起,咱们从来不刻意去作念所谓的互异化竞争,作念的都是主流家具、主流行业、主流诓骗、主流客户。不管是视觉软件、多模态大模子照旧灵巧手,从本事到家具形态都越过主流,干事的客户亦然来自汽车、家电、物流、电商、工程机械、钢铁等大行业。
作念公司不是一定要作念互异化,主流商场硬碰硬,反而更容易出巨头。
妖怪在细节说出来不怕你们见笑,我在德国留学时作念机器东谈主研发,其时念念着谁要投我一个亿,那可太蛮横了,我把家具本事作念到顶尖,就能让全寰球每一个东谈主都领有机器东谈主。
今天,梅卡曼德还是融了多轮,是全寰球“AI+机器东谈主”范畴限度最大的独角兽企业。但我对行业反而越来越敬畏、越来越谦善。
十几年前入行时,我就发现这个行业和我念念象中不太一样。2012年我本科从清华软件学院毕业,去了德国慕尼黑工业大学学习机器东谈主,毕业后在德国一家闻明的机器东谈主企业职责,参与其时起先进工业机器东谈主的研发。我以为我方每天作念的都是算法、东谈主工智能、自动终了这些高大上的东西,哪知谈拧螺丝、焊板子、修电路,哪样都没落下。
在德国那几年,我相称于一个全栈工程师,从东谈主工智能算法到焊板子,啥都得会点儿。这段资历也让我显著,机器东谈主从来不是什么高大上的行业,它其实充斥着多数细节。
创业于今,我还是跑了跨越200家工场了,直到今天,国表里好多客户的现场我照旧要去,因为你不可虚拟去念念客户要的到底是什么,只须亲身到工场和工东谈主深刻了解,才能知谈真确的需求。
就比如搬个箱子,看着很肤浅吧?但这里面依然有细节条目:堆放箱子时,标签要朝向外边;箱子穿插着堆放,才能培植厚实性;若是出现问题,该怎么贬责?
在这些方面,咱们遭遇过各式哭笑不得的情况。
难忘刚创业那两年,有一次咱们接到客户电话,降低咱们家具怎么不好使呢?我立马派东谈主火急火燎赶当年,扫尾发现是一只大蜘蛛趴在上头挡住了镜头。
这个事你不可怪客户,更不可怪蜘蛛。其后为了贬责访佛问题,咱们就得让相机有很好的防水防尘服从,镜头得能经得起刷子、扫帚致使水的清洁,还有成像极度的自我监测功能等等。
除此以外,咱们还遭遇过以为家具出了故障,其实是客户那处网线断了、无线鼠标没电了、电源没接上等等各式情况,看似是马勃牛溲,但都是咱们落地过程中实践发生的事情。
这个老练的过程跑不掉,因为制造业的需求就口舌常碎——不仅工艺、才略、场景多,且高度碎屑化,每家公司的需求、遭遇的问题也都不一样。我常说制造业瞭望是个万亿商场,近看是一堆一亿的商场。
但亦然这些多数的确的需求、数据的反应,让咱们能不停千里淀和迭代。
当年在物流制造行业,咱们的家具反复迭代几个星期几个月都平方,比如到了客户现场,发现相机服从不好,咔咔调半天,终末照旧不够齐全。接下来就用算法来弥补,又是咔咔商议半天,扫尾发现还得堆数据。这些弄完之后,软件再加功能,再和现场的拓荒适配,之后需要集结运行看是否厚实。这一套操作下来,周期天然就拉长了。
但今天,当咱们再去现场时,各式该念念到的问题咱们还是见过好屡次了,每个才略都不需要那么永劫间,一般几天致使几个小时就贬责了。咱们把这些千里淀来的申饬制作成培训文档,翻译成了五国谈话。公司还老练了一个AI助手,收录了几万条常见的客户问答记载,再遭遇问题,客户我方就能先进行排查致使是贬责。
直到今天,我还充任着公司的“一号客服”。我可能莫得时期再跑那么多工场,但会条目公司每一个客户干事的群里都把我拉进去,其实绝大部分情况下也不需要我说什么,但我要看客户在群里遭遇了什么问题,提了什么需求,这种敏锐度是我依然要保持的。
是以咱们这类家具,一半是靠前沿的本事研发,一半即是靠现场打磨。妖怪在细节,恰正是这些细节,终末组成了梅卡曼德的资产和壁垒。
作念到头部的高技术公司,众人在科技方面其实是会趋同的,就像自动驾驶一样。机器东谈主行业有个特色:莫得“黑科技”、“银枪弹”和独门隐讳,众人讲来讲去,无非照旧多模态大模子、视觉强化学习、仿真老练、手眼脑协同,因为这即是行业的本事道路,只不外里面是多数的落地细节。
空洞起来,无非四个字:易作念难精。就像机器东谈主叠个衣服,从视频展示到实践落地,中间需要巨大的飞跃。
2016年归国创业时,我去参加创业路演,看台上的自动驾驶公司播放视频,其时认为,哇,这车开得也太好了。但直到今天,发现这些自动驾驶公司的 demo 照旧和之前一模一样。天然,有的公司还是上市,有的还是消散。咱们这个行业亦然如斯,你作念一个 demo 是容易的,但念念真确作念到实践大限度的诓骗,越过清苦。
这些年每每有媒体、投资东谈主,致使是创业者,老是特地不测期待这种“银枪弹”,仿佛只须从兜里面掏出来,就能亮瞎全场,转眼贬责所有这个词问题。从我2012年入行驱动,这十几年的申饬告诉我,这样的银枪弹不存在,机器东谈主行业即是这样一个超等复杂、不停迭代、充满多数本事模块和细节的工程问题。
咱们这些年亦然在不停摄取各式大模子、VLA、视觉等方面的本事,逐渐掌合手、迭代,再加上对细节的打磨后,才率先打破了从demo 到跨行业、大限度、全球化诓骗的门槛。今天,梅卡曼德的家具干事了全球100+的《资产》500强客户,业务遮掩了五十多个国度和地区,集结五年市占率第一。
(梅卡曼德家具诓骗于千行百业)
走到这一步之前,咱们并不知谈风会往哪个标的吹。
等来的风口八年前创业时,我都备料念念不到今天机器东谈主行业会火成这个口头。
这个风口,还简直等来的。
2016年咱们给公司起名叫Mech-Mind,那时候还每每需要评释智能和机器东谈主诱惑有什么用,致使就连机器东谈主这个专科都很冷门。若是没记错,2012年清华那届几千名毕业生中,去德国读机器东谈主的可能就我一个。
创业,一方面是看到了机器东谈主的瓶颈所在,我看望了上海、深圳的潜在客户,关于创业要贬责的问题心里有了数;另一方面,是看到了本事的拐点,2016年AlphaGo 战胜了李世石,规画机视觉也有所发展,在国内那波创业高涨中,咱们成立了梅卡曼德。
创业前后,也见证了行业的几个周期。2013年年底,谷歌一举收购了8家机器东谈主公司,这其中就包括波士顿能源(Boston Dynamics),这一系列大手笔收购,在机器东谈主行业创下了记载;2021年,中国机器东谈主行业有两百多起融资事件,又掀翻一波小高潮。
比起名义海潮的噪声,我更关心水下潮水的标的,是以再濒临当下的高涨时,咱们的升沉没那么大。毕竟创业这些年,没少资历一些无名、冗忙的时刻。
华创投资咱们的Pre-A轮时是2017年4月,那时候梅卡曼德成立不外才半年,莫得任何客户,都备成型的家具也很少,但华创能在越过早期的时候就认同咱们。直到2017年底,咱们才终于有了第一个客户。
若是回看公司这八年,咱们资历了四个阶段:本事累积、家具落地与诓骗、家具迭代与限度化,以及商场全球化。其中第三个阶段最冗忙。因为前两个阶段商场对行业的关心度还没那么高,尽管有压力,但咱们依然可以按照我方的节拍冉冉打磨家具,更多时候是在和客户沿途探索标的。
可是到了第三阶段起量时,压力就来了。就好比原来你开个小馆子,一天只需要作念 100 个宾客的菜就行,蓦地有一天你要招待 1000 个宾客,就会发现所有这个词东西都不够,每个才略都驱动出问题。
那时候咱们的硬件坐褥供应链、软件算法、现场的诓骗调试渠谈、客户干事的里面经由轨制,每个方面都在透露问题。就像驾驶着一架飞机还是升起了,扫尾蓦地发现,哎呀,我这飞机怎么这样多问题,就只可一边修一边飞。
其时是2021年傍边,咱们刚参加千台阶段,公司收入还不及以守旧起一个完整、高效的团队和坐褥体系。客户量是上来了,但他们关于贬责备题的节拍提倡了更高条目;供应商也不够防御咱们,不会给咱们最佳的资源。那两年还碰上疫情,东谈主员服从、工场成就都受到了影响。其后为了重建供应链、组建新工场,咱们还去学习了华为IPD经由,总结才冉冉一步步进行了完善。
这即是机器东谈主行业创业不吉的场地,因为它是一个本事至极综合且链条独特长的行业。你总不可跟客户说:“您看这 99 个本事,咱们六合无敌,就这一个本事不太行,您忍着点。“那详情不行。
机器东谈主是一个互相耦合的综合性系统,任何一个才略都不可缺失,是以必须无间迭代本事家具。若是不具备合理的计策、可行的战术、高效的实践,每一层都会筛掉一泰半的公司。历史上机器东谈主创业失败的案例远多于得胜的,今天成了的公司,10秒钟可能就数罢了。
是以咱们能把这条路跑通,很大一个原因即是因为聚焦。从创业第一天起,咱们就坚韧聚焦在机器东谈主的视觉、大脑,其后又加上手。从本事逻辑来推理,这些即是机器东谈主最中枢的模块。通用的不是机器东谈主实践,而是中枢身手和组件。
每每有东谈主问咱们为何不作念机器东谈主实践,因为实践更多属于机械终了、电气,这些不是咱们公司擅长的。而且从生态位酌量,实践厂商更多是咱们的合作伙伴。在莫得要紧的本事变量的情况下,创业公司去作念这些事情,也费力契机。
既然咱们最擅长作念机器东谈主的传感、感知、贪图和有辩论,咱们就该专注我方擅长的事,先找到有价值的场景酿成迷漫竞争力,再去快速迭代、渐渐推广。
太多东谈主只关心末端,但更迫切的是旅途和速率。相通,好多东谈主也以为能追优势口,但你需要先专注我方,才能等来风口。
生而全球化
2024年3月,咱们梅卡曼德东京LAB开业,我第一次当着400东谈主的面进行了十五分钟日语演讲,在AI的匡助下,练出了一口正统“池袋口音”。我目下能用中、英、日、德四国谈话作念演讲,全球化,得先从我方作念起。
2019年在咱们还很早期的时候,梅卡曼德就驱动探索国外商场,只不外那时候更多是但愿获取一些反应来率领家具开发。比及真确以扩伟业务为宗旨来作念国际商场,是在 2021年,那时候新冠疫情还莫得都备终了。
咱们出海从来不是为了逃离内卷,而是因为机器东谈主这个行业不存在单纯只作念中国商场的公司。
滥觞,梅卡曼德作念的“眼脑手”属于通用型家具,像西门子、基恩士、康耐视都不会坐褥所谓的原土家具,一定是面向全球的。从历史看更是如斯,所有这个词工业范畴的通用器件型公司,就莫得local的公司,众人的宗旨和交易逻辑都是全球商场。若是我不作念全球商场,那终末所濒临的商场限度可能只须全球总限度的 1/4。
其次,发扬国度的高标准能推着咱们进取走,这种压力越过迫切,因为所有这个词ToB的好公司,终末一定是被一些高标准的客户带起来的,咱们参加发扬国度商场,就大致倒逼咱们成长。
终末,机器东谈主行业不像破钞品那样地区个性化很隆起,工业品在不同国度之间的互异也莫得那么大。就算咱们不出去,那等国外同类公司发展起来之后,他们也会加入竞争。
梅卡曼德作念的具身智能“眼脑手”,濒临的是一个全新的商场,这之前不存在一个还是作念得很大的公司,还是把客户的心智以及家具的生态位占住,这对咱们是更大的优势。
既然咱们这种标准化家具注定要濒临全球竞争,末端如斯,就要以始为终,实时入局。不然将来你不攻出去,别的竞争敌手也会打进来。
基于这些判断,咱们一上来就不作念低廉货,而是就要作念寰球第一。不管从重要的性能、质地的标准,照旧各方面的完成度上,咱们即是要作念一个好的家具。
是以,一朝念念好我方是一家Global的公司,就要把它作为系统性工程,而不是派几个销售、业务东谈主员放洋跑单据,这样是作念不起来的。
拿日本例如,三菱、发那科、川崎、基恩士等日本企业,占据了自动化行业半壁山河,客户遍布全球。能立足于日本商场,就能影响全球。为了作念好当地的干事,咱们有日语的全套辛苦,在日本建立了Local Support团队,其中包含几十东谈主的专科培训东谈主员,还有全套专科的时事来给客户作念培训,包括我本东谈主也在学日语。这样防御的气魄,不仅客户能感受到,公司里面的每个东谈主也能感受到,知谈公司从一号位驱动即是下决心要作念好全球化的。
出海是一个公司的身手,而不单是是任务,需要体系布局和恒久计策贪图。从家具开发、坐褥质地、客户培训、文档到售后救济等等,所有这个词的东西都要为全球化作念好准备。
天然,咱们是计策上要捏紧,但战术上不可过于急躁,不然作念不好口碑,会有副作用。所幸这一齐梅卡曼德也走得很塌实,获取了全球多数客户,包括上百门第界 500 强客户的认同。
目下,梅卡曼德在好意思国、德国、日本、韩国都确立了子公司,国际的业务收入还是占到一半比例。
正是当年这八年间所作念的每一个家具,迈出的每一步路,让咱们在冲向具身智能末端的过程中得以上桌,何况获取了一个好的位置。
我一直认为咱们的运谈可以,滥觞是收拢了时机,若是作念太早,大模子、深度学习、传感等主流本事还没出现,就无法诓骗在家具中;若是作念太晚,这个商场就没咱们什么事儿了。其次,咱们对我方的家具形态、家具化的理念以及交易模式一直越过坚韧,公司的计策标的、道路一直莫得变过。
创业时候我没几许职守,既不是什么公司高管,也不是大教导,只是找到了一个我方疼爱、擅长、念念扶直下去的事情。一齐走到目下,我不敢说我方还是作念好了所有这个词的准备,但至少大致全身心参与到这样一件本旨东谈主心的事情中。
机器东谈主发展到目下六十多年,也只参加了汽车、半导体、物流等少数行业,畴昔一定很快会参加更多行业,带来通盘社会极地面范式飘浮。届时,到底是哪家公司作念出了通用机器东谈主,还是没那么迫切了。
因为咱们这些作念东谈主工智能的东谈主,从来莫得让某个本事局限于某家大公司。操作系统、开源大模子,机器东谈主本事不可能被一两家公司都备摆布。若是这种事发生,众人就会协作起来,再行去开源。今天的寰球天然千疮百孔,但东谈主工智能本事,是通盘寰球能通向解放的真确力量。
机器东谈主也从来不是一个个东谈主英雄主义的行业,它不像数学这样的范畴,某一两个大神靠一己之力就能作念起来。是以咱们不迷信天才,不指望遗迹开云体育,只校服一拳一拳,一步一步,就能让机器东谈主的智能再上一个台阶。