張一鳴黃仁勛,想到一塊兒了
(圖片來源:攝圖網)
作者|李炤鋒 來源|字母榜(ID:wujicaijing)
具身智能如今已成為最火的產業之一,中國行業龍頭宇樹科技上市正在緊鑼密鼓進行,而中美科技巨頭則在水下更深處進行宏大布局。
今年3月,在GTC 2025主題演講中,英偉達CEO黃仁勛演示了挪威機器人公司1X 的NEO Gamma人形機器人。這款機器人運用了基于英偉達GR00T N1模型構建的后訓練策略,并執行自主整理任務。
黃仁勛試圖以此證明,人形機器人的未來在于適應性和學習能力。換言之,機器人到底行不行,關鍵要看“大腦”能否適應環境、能否學習新知識。
黃仁勛的話很快應驗。幾個月后,全球科技巨頭在“機器人大腦”這件事上拿出了新成果。
8月,英偉達推出Jetson AGX Thor,一塊能在機器人本體上同時運行多個生成式AI模型的邊緣計算平臺。它被行業公認為“機器人新大腦”。
Jetson AGX Thor(以下簡稱 Thor)是面向機器人和物理設備的新一代技術棧。這個全新的“機器人大腦”基于Blackwell GPU架構,峰值算力達到2070 FP4 TFLOPS,AI 性能較現有的Jetson AGX Orin模塊提高多達7.5倍,同時能效提升3.5倍。
Thor最大的突破在于,它可以讓過去依賴云端處理或多塊芯片的機器人,在單一緊湊的模塊上實現實時感知和決策。
目前,亞馬遜倉儲機器人和波士頓動力等早期用戶,已經開始在自家產品上集成Thor,目標是打造出更智能、更獨立的機器人產品。
地球的另一邊,字節7月和9月先后推出自研的通用機器人模型GR-3和Robix,展示了在真實家庭場景下執行復雜任務的能力。
字節Seed團隊7月底放出一條演示視頻,一臺機器人搭載了字節最新的機器人VLA成果GR-3。在演示視頻中,它完成了將衣架插入襯衫并將其掛起來的任務。
上周,Seed又掏出了最新的機器人研究成果——Robix。它和GR-3一起,組成了字節新一代機器人模型矩陣。
此時距離黃仁勛在 GTC 2025 的感慨僅過去半年時間。兩家巨頭在機器人賽道的“同頻”,也給人這樣一種印象:黃仁勛和張一鳴,這次想到一塊去了。
一
在Thor橫空出世前,英偉達已經成為機器人賽道的領頭羊。
英偉達Jetson平臺在高端機器人和自主機器開發領域占據主導地位,其生態系統中擁有超過200萬名開發人員,超過7000家公司使用上一代產品Orin系列。
今年8月,英偉達宣布Thor 正式開售。單從硬件性能和成熟度來看,它在同類產品中幾乎處于絕對領先的地位。
目前,英特爾、高通等競爭對手的邊緣AI(Edge AI,在設備端本地運行人工智能)產品相對落后,尚無法在單一模塊中實現同等水平的集成計算。
更關鍵的是,英偉達將硬件與軟件堆棧緊密綁定,并依托CUDA工具包的廣泛應用,形成了生態護城河。
Thor可以直接調用英偉達完整的Isaac機器人軟件平臺、AI模型庫和仿真工具,實現端到端的深度集成。其中包括英偉達針對機器人場景的最新模型——Isaac GR00T N1,一款開源、預訓練且可定制的基礎模型。
GR00T N1采用了受人類認知啟發的雙系統架構。一個系統是“快速思考行動模型”,其行為類似于人類的反應和直覺;另一個系統是“慢思考模型”,能夠推理周圍環境和收到的指令,從而規劃行動。
GTC 2025上, 1X公司CEO Bernt Børnich表示:“在我們開發自主模型的同時,英偉達的GR00T N1顯著提升了機器人的推理能力和技能。我們僅使用極少的后訓練數據,就將NEO Gamma完全部署到位。”
然而,Thor并非完美無缺。
首先是價格。Jetson AGX Thor開發套件的售價為3499 美元,很難成為普通家用產品的選擇。
此外,Thor平臺有著更高的功率要求,這意味著其適配的產品需要穩定的供電能力,例如自動駕駛汽車、工廠機器人、送貨機器人等。
二
在“機器人大腦”的賽道上,英偉達很快有了中國競爭對手。
7月底,字節發布全新一代機器人VLA模型GR-3。官方演示中,搭載著GR-3的機器人ByteMini將衣架插入襯衫并將其掛起來,還完成了拾取家居用品、放置在指定位置等高難度“副本”。
此外,ByteMini可以區分不同尺寸的物品,并成功執行拿起“較大的盤子”的指令。
拆解演示過程和技術報告可以發現,GR-3能夠理解復雜、抽象的語言,比如“較大的盤子”“左邊的椅子”等。
此外,GR-3少樣本適配能力較強。據外媒報道,Seed采用混合方法訓練:首先向 GR-3 輸入大量圖像和文本數據,隨后借助虛擬現實環境中的人機交互進行微調;最后再讓其學習并模仿現實世界中的機器人動作。這套訓練策略,使 GR-3 具備了在復雜且難以預測的環境中保持適應性的能力。
據了解,GR-3相比GR00T系列有著更大的參數規模,實際應用中表現更好。
曾在Meta就職的AI科學家Chris Paxton在一篇關于機器人領域VLA的研究中披露,字節的40億參數GR-3模型,表現似乎優于英偉達GR00T,后者參數量大約 20 億。可以合理推測,一旦有足夠的數據和算力支撐,“規模定律”(scaling laws)依然有效。
GR-3讓字節在“機器人大腦”賽道有了一席之地,不過,VLA模型更多是用在執行層面,相比起“大腦”的定義,GR-3 更像是機器人肢體的“神經元”。
字節Seed團隊的最新成果,補齊了“機器人大腦”的另一塊拼圖。
上周,Seed團隊發布最新成果 Robix,在機器人系統中負責任務規劃、推理、自然語言交互等任務。
Seed研究員董恒在個人主頁上這樣描述Robix:“這是一個集推理、規劃和自然交互于一體的統一機器人大腦,其性能優于GPT-4o和Gemini 2.5 Pro。”
不過,Robix并不是“機器人大腦”完全體。
根據Robix 的技術文檔,流程中“身體動作/執行”部分通常由低層控制器模型來完成,也就是對應的VLA模型,如GR-3或類似控制器。換言之,GR-3 和 Robix 需要在驅動機器人的場景中相互配合。
Robix的這套工作邏輯,和英偉達GR00T N1的雙系統模式有共通之處,一個系統負責推理,另一個系統負責執行。
在官方測試中,搭載GR-3作為控制器的Robix,通過 ByteMini 機器人完成了餐桌清理、收銀裝袋和飲料篩選的任務;與其他模型橫向對比,僅在飲料篩選項目上略微落后于 Gemini 2.5 Pro,其他項目均得分最高。
三
Robix和GR-3不是字節第一次在機器人VLM領域“秀肌肉”。很多人把字節看作互聯網內容公司,但在機器人領域,它其實是一位低調的“隱形巨頭”。
2023年12月,Seed團隊推出GR-1,該模型也是Seed在機器人VLA領域的前瞻性實驗。作為技術驗證產品,GR-1采用了先用大規模視頻生成式預訓練,再無縫用機器人數據微調的模式。
基于GR-1的技術積累,Seed團隊2024年推出GR-2。GR-2使用了3800萬段視頻、超500億token的數據作為預訓練的基礎,然后再用機器人軌跡做動作/視頻生成微調。它在超100個操控任務測試中的平均成功率高達97.7%。
GR-3 和 Robix,是字節在大模型時代研究領域延伸的最新一環。
《晚點LatePost》在 2023 年的報道中披露,字節的機器人探索始于 2020 年。當時張一鳴就對機器人表現出興趣,此后會不定期參與機器人項目討論。
兩年時間過去,字節已經悄悄量產了1000 臺以上的機器人。這些輪式物流機器人主要用于在倉庫、產線上運輸包裹與零件,聚焦于“倉儲+自動搬運”的一體化方案,能自主學習、規劃路線、移動到目的地,服務于自家的抖音電商倉以及順豐、比亞迪等外部客戶。
不過,這些物流機器人更多是早期的技術積累。從 Robix、GR-3和ByteMini的技術發展路徑不難看出,字節致力于在具身智能領域取得領先地位。
近期,字節招聘官網涌現出一批機器人相關的崗位,其中有崗位明確提到“下一代通用機器人”。所有崗位都屬于Seed團隊,base在北京和上海。南華早報在7月的報道中披露,Seed團隊今年人數預計超過300人。
另一方面,字節在機器人產業中也積極投入。
此前,國內具身智能頭部企業宇樹科技完成C輪融資,公司估值超百億。該輪融資的金主名單中,除了阿里、騰訊系的名字,也出現了與字節淵源頗深的錦秋基金。
錦秋基金由原字節財務投資負責人楊潔2022年創立,團隊核心成員多來自字節的投資體系。其名稱“錦秋”源自張一鳴和字節的創業時的發源地——位于北京海淀區的錦秋家園。
四
字節正在公司內外加速布局機器人領域。不過,目前字節的技術積累主要是模型側的“機器人大腦”層面;而英偉達的最新芯片方案,似乎和字節形成優勢互補。
多年以來,字節是英偉達在中國最重要的客戶之一,而黃仁勛也深知中國企業在具身智能市場的重要地位。
今年7月,他現身北京鏈博會開幕式,并在發言中表示:“AI的下一波浪潮將是機器人,未來的機器人不僅能夠推理和執行,還能真正理解物理世界。”
對黃仁勛而言,中國市場在這條路徑上具有不可替代的意義。
英偉達官方博客顯示,多家國內公司已經使用Thor,包括聯影醫療、萬集科技、優必選、銀河通用、宇樹科技、眾擎機器人和智元機器人等。不過,在這一長串名字中,尚未見到字節的身影。
英偉達博客還引述了宇樹科技CEO王興興的發言:“Jetson Thor帶來了計算能力的巨大飛躍,賦能機器人更強的敏捷性、更快的決策制定以及更高的自主水平,這對于機器人在現實世界中實現導航與交互至關重要。”
2025年1月,在CES全球消費電子展上,黃仁勛與14家合作的人形機器人公司一同登臺,其中6家來自中國,包括宇樹科技和小鵬等企業。
另一方面,字節 Seed 團隊并非只聚焦機器人模型領域。
在測試 GR-3 和 Robix 的過程中,字節同步推出了ByteMini。盡管看起來更像是測試用途的實驗性產品,但瀏覽 Seed 團隊的技術報告可以發現,這款機器人的技術規格并不低,包含 22 個自由度,手腕采用球形腕設計,在狹小空間/高靈巧任務中有較高的操作能力。
可以說,ByteMini的出現,已經顯示出字節打造下一代具身智能產品的野心。而隨著英偉達拿出了新一代機器人芯片方案,想到一塊去的黃仁勛和張一鳴,似乎有望在機器人領域,延續這兩家頭部企業的合作關系。
編者按:本文轉載自微信公眾號:字母榜(ID:wujicaijing),作者:李炤鋒
廣告、內容合作請點這里:尋求合作
咨詢·服務