所有語言
分享
來源:量子位
作者:衡宇
原標題:《對話稚暉君:具身智能創業窗口轉瞬即逝,打擂瞄準偶像馬斯克》
馬斯克是我偶像,很榮幸能有機會在這個賽道和他同台競技。
說出這話的稚暉君,十分清楚他離開華為創業要做什麼:
對標馬斯克,做通用機器人,競品擎天柱,既面向星辰大海也奔着商用落地,產品目標最終定價不超過20萬人民幣。
換成最流行的說法,他在做大模型和機器人結合的具身智能。
想法始於他學生時期的探索。
早在他還沒成B站up主的2015年,學生身份的稚暉君就參与組織了一群打比賽認識的小夥伴,準備“做個人吧”:
當時,普通人對AI的切身感受還是人臉識別或美顏這類應用,大模型概念還沒誕生,“要讓機器人具備像人一樣的思考和行動能力”這個命題,似乎離實現還有點過於遙不可及。
因此,畢業后的稚暉君沒繼續只在機器人身上折騰,而是選擇進入AI賽道,成為大廠的AI算法工程師,在軟件算法領域幹了好幾年。
直到ChatGPT石破天驚,大模型智能湧現,OpenAI證明大力堆疊真的可以產生質變。
回看自己的機器人夢想,稚暉君又看到了這條路的可行性。
所以,離開菊廠,投身創業。
於是半年時間,他帶着團隊拿出了一套有模有樣的原型機。
8月發布會上,被稚暉君自豪請上台的自家機器人步伐穩健,行走效果可以比肩去年馬斯克擎天柱Optimus的初亮相。
就是憑藉這樣一款作品,他的初創公司智元機器人,在投資者冷靜但賽道又火爆的當下,成為了少數幾個拿到VC和大廠戰投重金押注的標的。
發布會結束后和量子位的會面,他表露出對發布會、團隊和整體進展的還算滿意,也表露出沿着這條路往未來走的信心。
還在他的工位前告訴我們,他的桌面壁紙已經換了很久了:
全身心投入人形機器人創業,他會怎麼看待自己公司的高估值?智元的下一步規劃是什麼?商業化落地場景將在何方?創業過後這個百大up主的B站賬號咋辦?
量子位問,稚暉君答,一切都在這次對話中。
稚暉君算是最早感知到這一波大環境變化,並且付諸實踐的那撥人。
外界看來,他去年年底宣布創業時,機器人和大模型都是科技領域的大熱議題,尤其是ChatGPT剛出道,帶給大家暴力美學的震撼。
那個時間節點,賽道遠沒有今天擁擠。技術從業者聞風而動,不算意外。
但稚暉君第一次透露了他當時的心態:
要是選擇再晚一點,也許就沒必要出來創業做這事了。
為了解釋這句話,他給競品特斯拉擎天柱拉出一條時間線:
去年9月展示原型機,今年5月展示識別周圍環境存儲記憶和準確控制物品拿放的能力,7月表示已經生產10台,預計11月進行行走測試,明年在特斯拉自己的工廠進行實用性測試。
動作很快,實際效果也哇噻。
馬斯克,一個從不按套路出牌的男人,自從宣布入局機器人賽道,就用火箭般的速度推進量產節奏,在他的口中,未來機器人的數量會超過人類。
稚暉君看到這一切,心潮澎湃。
與此同時,他也觀察到機器人和大模型結合的潛力。
微軟的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,還有VoxPoser、RoboCat等眾多工作,都在嘗試把圖像語言大模型的能力和知識遷移到機器人領域。
其中轟動最大的谷歌RT(Robot Transformer)系列,在論文闡述和demo視頻中,都展示出抓取領域非常優秀的泛化能力。
要做到這一點並不容易,核心門檻,在於數據。
光是訓練它,谷歌就花了17個月,收集13台機器人的13萬條機器人真實數據——這大概也是RT模型開源而數據暫時閉源的一個小小心機。
稚暉君坦言,雖然也從一開始就在準備自家的動作任務數據集,但目前能用來訓練自家產品的數據,“只有上千”。
一對比,差距之大,顯而易見。
数字上的直觀差距,足以解釋稚暉君對量子位說的,“當前節點,遠征A1最需要提升的地方,是數據帶來的AI泛化能力”,足以解釋這為什麼“會是一個相對長期的布局”。
也能部分解釋發布機器人時,直播間網友對展示時間較短、展示能力不如想象炫酷的疑問。
“我覺得要想達到真正理想的實用效果,還是需要大量的真實場景數據。我們時間太短了,這方面還沒有做夠積累。”稚暉君如是說。
競爭對手不會給你多留喘息的機會。正因如此,稚暉君表示團隊接下來的工作重心之一,是建立自己的數據中心。
計劃未來幾個月內落地臨港,主要目的是搭建場景和仿真平台,填補運動數據,提高泛化能力。
數據是如何生成的?稚暉君的總結有三:
建數據中心是工作重點之一,另一個重點則是對硬件結構進行迭代重構,加強機器人本體運動性能。
按稚暉君的說法,團隊會用做軟件敏捷開發的速度和效率去迭代硬件。
這是非常顛覆並且有挑戰性的一件事情。
此處送上小八卦一則。
今年4月,智慧軍在投稿B站的自製雙足機器人哪吒,並在視頻結尾表示,“如果不出意外的話,哪吒會成為發布會的彩蛋”。
當然了,按照經典劇情,不出意外的話果然就出意外了:D,哪吒並沒有上發布會。
就是它 ↓
量子位幫大家打聽到,原因是哪吒上面用到的幾個電機被供應商鴿了,3月下的訂單7月才收到貨,導致開發時間不夠。
稚暉君說道:“後面有空還是會繼續完成這個項目的,鴿王有坑必填。”
讀到這裏大概能察覺,智元人形機器人項目的機器人本體,還需要迭代幾版;而AI能力受限於當前訓練數據不足,也還需要積累一段時間。
總體來說,產品離落地似乎還有一段距離的樣子。
然而就是這樣一個創業項目,半年估值直奔10億美元開外。
這合理嗎???
聽到這個問題,稚暉君並沒有直接回答到底“值或不值”,只是回答道,其實融資思路也不是一開始就定型的,期間參考了很多行業大佬和前輩的建議。
團隊最初的設想很單純,就是先做出Demo,然後順其自然地提高估值。
“但創業顯然不是那麼單純的事情,大經濟環境不算景氣的背景下,要整合資源、吸引人才,無一不需資本的背書。”稚暉君表示,“這並不是一件壞事。”
高效實幹,快速調整思路和策略,以結果導向推進事情,這是稚暉君的行事風格。
他的風格最終也決定了智元,至少是智元研發團隊的工作風格。
技術團隊每個早期成員都是他親自面進公司的,30多號人基本都是自來卷,卷得一天睡五、六個小時的稚暉君都心生感慨:
之前大家都覺得我是時間管理大師,現在我可以很慚愧地講,我們公司像我這麼肝的,還有一堆……
整個交流過程中,量子位關注到他強調了兩個關鍵詞,“壓成本”和“應用場景”。
這倆是目前整個賽道的普遍痛點。團隊如何解決痛點,必然是他們獲得高瓴、鼎暉、經緯、高榕、藍馳、BV百度風投等頭部資方重金押注的關鍵。
來聽聽稚暉君的看法——
先說壓低成本。
現在智元對外喊出的口號是,人形機器人落地控價20萬元內。
這約與馬斯克放話的7萬美元售價持平,而國內類似人形機器人的售價水平在50萬RMB上下,大家喜聞樂見的波士頓動力Atlas,成本則在200萬美元。
稚暉君直言不諱:“不是我們希望做到20萬元,而是如果做不到20萬元的價格,就根本沒辦法實現商業落地。”
至於為什麼是20萬,他表示,以新能源汽車製造業為例,20萬的機器人替代部分人工崗位的話,可以做到1~2年的投資回報期。
稚暉君也大致描述了一下智元為量產控製成本的方法。
一是盡最大可能採取自研路線,降本增效。
如關節電機和靈巧手等部件占硬件成本一半以上,而且市場現有供應還存在特性不匹配的情況,自主研發核心部件能讓成本降低一半以上。
二是採用類似特斯拉造車的部分思路,用軟件和算法補硬件方面的精度要求,降低硬件成本。
如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺閉環方案等等。
再說落地應用場景。
稚暉君表示,預計明年下半年商業化落地,先應用在工業製造領域,家庭等服務型應用場景都往後排,現階段突出一個“場景相對簡單,任務相對複雜”。
“這條路線是邊走邊摸索出來的,還是最初就定下的目標?”
“團隊還不到10個人時候的最早期,我們就基本敲定了這條落地方案。”
同時表示,
很多人會拿我們或者特斯拉的機器人去跟波士頓動力對比,其實是不合適的。
奔着商業化落地去做, 正確的邏輯應該是:在滿足應用場景功能和性能需求的前提下,以盡量最低的成本去實現方案。
所以能走着去搬東西的場景下,就沒有必要非得讓它有能力后空翻。
現在,這條半年前定下的路線,最終落地跡象愈發明晰。
最新工商動態显示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國產頭部智能汽車廠商和3C廠商等密切洽談。
由此在官宣前推測一波,遠征A1在工業製造領域的首發打工地點,不出意外,就是比亞迪汽車工廠。
除成本和落地場景這兩點外,隨着團隊對具身智能的愈發深入,智元手裡還握了些其它差異化的牌。
比如,量子位就從稚暉君口中挖到公司商業化的一條隱線——
如果說通用人形機器人是商業落地的中長期計劃和最終願景,那麼在邁向這個終點的過程中,團隊也會有一些“沿途下蛋”的產品形態。
具體是什麼形態呢?稚暉君一如既往地口風很嚴,賣了個關子,但還是有所透露。
他聽到過很多次疑問,問為什麼要把機器人做成人類形態,相比於其他專用形態(机械臂、輪式),是不是費力不討好?
針對這個問題,稚暉君有兩方面思考。
一方面,這會是一個長期投入的過程,大家不要高估短期的價值,也不要低估長期的價值。
人形是智元以終為始、面向終極形態邁出的第一步,這也是為什麼給這款機器人取名叫“遠征”。
另一方面,選擇做這件事情(人形)並不是因為它容易,反而是因為它很困難。
通用人形機器人牽涉到最全面的機器人技術棧,它的實現過程中各種前沿技術(視覺伺服、MPC、SLAM、LLM/VLM、中間件等各種技術的自研和優化)的沿途下蛋,可以催生很多創新性專用形態的機器人產品,“大家未來會陸續看到這些成果的”。
過人的技術,漂亮的簡歷,大廠的光環,百萬計的粉絲,又恰逢新技術爆發周期:大模型、具身智能、AIGC……攢局創業后,出任團隊CTO,帶領公司迅速壯大,半年時間,公司人數近百,市場估值超10億美元。
一系列附帶光環的故事砸過來,圍觀者不由得在這個時候,重新審視稚暉君。
他又會怎樣定義現在的自己?量子位把這個問題拋給了稚暉君本人。
稚暉君倒沒表現出什麼遲疑,只是說,他給自己的定位並沒有太大變化。
首先是個工程師,其次才是創業者。
我可能屬於一個非典型創業者,做這些事情的動力都是基於個人興趣,也很幸運取得了一些小成就:早期在大廠里發光發熱,頂了一些光環,又在網上獲得了不小的知名度,然後又突然跑出來創業。一開始身邊的人都覺得挺震驚的。
我一直認為自己是一個樂觀主義者。
還有句話,他說得毫不猶豫——
“既然人生沒有後悔的機會,那麼就堅持相信自己到現在的每一步,都是我做的最正確的選擇。”
“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開華為,脫離“天才”tag。
在量子位面前,他沒有掩飾曾經在華為工作取得榮譽的感激,也提到,
老東家在做一些很偉大的事情,但是像機器人這樣面向更未來領域的探索,可能更適合在小的創新團隊中去做。
希望自己能繼承‘散是滿天星’的優良傳統吧“。
然後,又像他常常做的那樣,再次強調自己既不是天才,也不再是少年。
能感受到,稚暉君更希望外界把對他的關注從一個具體的tag,轉移到他想做的事情本身。
有趣的是,他又勸大伙兒不要太早創業。“對於學生來說,建議還是要先工作幾年,接受一下社會的毒打,才對社會、公司運作的方式有一個清晰的了解哈哈。”
當時在發布會上,他也表達了自己的觀點:檢驗一家科技公司價值最有效的方式之一,就看它能否實現商用落地。
不然技術做得再好也容易陷入自嗨。
聊到這兒,稚暉君表露心跡,既然正兒八經創業了,項目也不能單純按照個人的奇思妙想隨意自嗨了。
組了人、拿了錢,就需要在公司戰略發展方向上多做考慮,“要為公司這麼多兄弟姐妹們負責”。
但顯然,他自有自嗨處:B站。
“個人號啊?這陣子太忙了(所以沒更新)。”稚暉君解釋到,稱自己絕對沒有挖坑就跑的意思,“後面稍微閑下來一點,還是會更新的。”
至於之後的B站投稿,還會是原來的風格,原來的味道,可能偶爾夾雜一些創業日常。
但他保證,不會變成純粹公司的營銷窗口。
(他暗示,畢竟智元有單獨的官方賬號,歡迎大家關注~)
“也是向馬斯克學習嘛,他在公司管理運營和個人賬號運作之間,就做得很好。”
話趕話聊到這兒,怎麼能不追問鴿王,下次B站視頻更新,在啥時候?
“今年一定,年底之前一定。”
內容與什麼相關?
“還是機器人吧,之前挖過的某個坑,下個視頻就是這個。”
好的,經本人授權,我們替他把話放在這兒了。
咕咕咕。