所有語言
分享
手機是一種娛樂設備,但如果你想完成一些事情,它就不是效率最高的機器。
圖片來源:由無界 AI生成
在 CES 2024 上,支持人工智能的小玩意兒可謂是琳琅滿目,而 rabbit r1 之所以能夠脫穎而出,不僅是因為其高辨識度的工藝和獨特的外形,還因為它的執着追求。該公司希望人們隨身攜帶第二台設備,以省去打開手機的麻煩。
售價 200 美元的 r1 背後的理念很簡單:在需要完成一些簡單的任務時,比如打車,或找個聚餐的地,我們可以不用掏出手機,一個簡單的命令,可愛的“兔子”就會替我們行動起來。
創始人兼首席執行官 Jesse Lyu 稱:“我們不是要扼殺手機。”“手機是一種娛樂設備,但如果你想完成一些事情,它就不是效率最高的機器。比如安排與同事共進晚餐,我們需要四五個不同的應用程序協同工作。大語言模型是自然語言的通用解決方案,我們希望為這些服務提供通用解決方案。”
不用再掏出手機、解鎖、找到應用程序、再打開它然後在用戶界面上操作(太費勁了!),直接掏出 r1,用自然語言向它發出指令:
“叫一輛 Uber XL 帶我們去現代藝術博物館”。
“給我列出步行 10 分鐘內的五家便宜餐館”。
“在 Airbnb 上列出海濱 10 英里內最適合六個成人的小屋,每晚不超過 300 美元”。
然後,R1 就會按照要求去做,幾秒鐘后就會給到信息進行確認。
是的,這其實很像我們所謂的“人工智能助手”在過去五六年裡一直在做的事情。就像“hey Siri”。但是,現在的 AI 助手有着巨大的區別。
Siri、谷歌助手、Alexa 以及其他所有產品都更適合被描述為“自定義小應用程序的語音界面”,而完全不像我們許多人從去年開始使用的聊天語言模型。如果你讓谷歌幫你叫一輛 Lyft 到你的當前位置,它會使用 Lyft 官方 API 發送相關信息,並得到回復 -- 這基本上就是兩台機器在對話。
雖然這並沒有什麼不妥,但通過 API 所能做的往往非常有限。而且,助手和應用程序之間必須有正式的關係,即經過批準的付費連接。如果你喜歡的應用無法與 Siri 兼容,或者 Alexa 可以訪問的 API 已經過時,那就沒戲。而一些小眾應用規模太小,無法與谷歌達成官方協議,又該怎麼辦?
rabbit 所設計的產品更像是去年出現的“代理”型人工智能,即在網站和應用程序等普通用戶界面上訓練出來的機器學習模型。因此,它們不是通過達美樂專門的應用程序接口(API),而是像人類一樣,通過點擊普通網站或移動應用程序上的普通按鈕和字段,就能訂購披薩。
該公司在無數常見應用程序的屏幕截圖和視頻上訓練了自己的“大型動作模型”或 LAM,因此,當你讓它在 Spotify 上播放鮑勃 - 迪倫(Bob Dylan)的舊專輯時,它也知道如何進入迪倫的藝術家頁面,按發行日期整理專輯,然後向下滾動,播放一張最老的專輯。
你可以在官方演示中看到這一操作。
那麼,如果是一個 r1 不知道的應用程序呢?rabbit 稱 r1 可以通過觀察你使用該應用程序來學習 -- 不過這種教學模式不會在發布時提供。(Lyu 表示,他們在《暗黑破壞神 4》中已經實現了這一功能,所以它可能可以處理 AllTrails)。
當然,r1 無法獨立按下應用程序中的按鈕,一來它沒有手指可以按,二來它也沒有賬號。針對第二個問題,rabbit 建立了一個所謂的“rabbit hole”,在這個平台上,用戶可以用登錄憑證激活服務,但這些憑證不會被保存。激活后,服務器就會像你一樣使用普通的按鍵來操作應用程序,不過是在某種模擬環境中。
Lyu 說:“把它想象成把你的手機遞給你的助手,”“我們要做的就是讓這個東西幫你按鍵。它們在後端看到的只是你在嘗試做事情。這是完全合法的,也符合服務條款。”
顯然,rabbit 在技術方面下了不少功夫,但真正的問題是,除了手機之外,是否有人真的願意隨身攜帶這麼個東西。它的售價是 200 美元,無需訂閱,但需要提供 SIM 卡。相比於 AirPods,r1 便宜,而且也有很多有趣的功能。
另外,它的一個明顯優勢是外觀。它是由瑞典消費电子公司和製造商 Teenage Engineering 設計的,要知道這家公司做出了很多好物。
你可能會問,為什麼要在一個可以通話的東西上裝一個屏幕?因為屏幕可以显示可視化信息,比如搜索結果或確認你的位置。有些人可能會問,既然一開始就需要確認這些東西,為什麼不直接用手機呢?
顯然,rabbit 的工作人員認為,把這個小巧(3 英寸 x3 英寸 x0.5 英寸)、輕便(115 克)的小工具拿起來,說出你想要的東西,然後使用滾輪和按鈕來瀏覽結果,在很多情況下比使用應用程序更簡單。的確,現在許多應用程序都設計得很爛,有些還有廣告危險。
那麼為什麼又要添加相機呢?據悉,r1 有一個有趣的磁性/自由浮動軸,因此旋轉起來可以保持水平,並指向任何你想要的方向。或許,rabbit 還有一些功能尚未準備就緒,比如測量卡路里或者詢問“這棟建築是誰設計的?”等等。視頻通話和社交媒體功能可能即將推出。
目前,這款設備已開放預訂,Lyu 說他們的目標是在三月底向美國地區的買家發貨。(之前大火的 Humane 也宣布 AI Pin 將於 3 月開始發貨。)
不過,最終的問題並不在於 rabbit r1 能否成功實現目標,而是在面對極其強大的競爭時,這種方法是否可行。
谷歌、蘋果、微軟、OpenAI、Anthropic、亞馬遜、Meta-- 它們中的每一家以及許多公司每天都在努力創造更強大的機器學習代理。對 rabbit 來說,最大的危險不是沒有人買它,而是在六個月內,一家市值千億美元的公司製造出了自己的行動代理,它能做到兔子所做事情的 80%,而且可以在智能手機上免費使用。
對於這個問題,手下只有 17 名員工的 Lyu 回答說:“我們當然擔心,我們是一家初創公司。但他們能做到這一點並不意味着我們就要停下腳步。”
他指出,儘管這些公司擁有龐大的資源,但它們也缺乏初創公司的靈活性,同時也缺乏數據。他指出,語言模型只是“基於一個開放的配方 -- 五篇論文,僅此而已”。“在這方面幾乎沒有機會形成護城河。但 rabbit 的 LAM 建立在專有數據的基礎上,針對的是特定設備上的特定用戶體驗。”
即便如此,即使 rabbit r1 更好或更可愛,人們還是更喜歡簡單和方便。既然一台設備就能完成大部分任務,人們又為什麼還要花錢買第二台設備呢?在短期內,這一問題答案是肯定的,Lyu 說預售訂單已經堆積如山。那麼,rabbit 還能生產下一代產品(大概是 r2)嗎?即使不能,這款炙手可熱的小設備也會作為人工智能熱潮中一個雄心勃勃的典範留在我們的記憶中。
原文作者:Devin Coldewey
文章來源:https://techcrunch.com/2024/01/09/can-a-striking-design-set-rabbits-r1-pocket-ai-apart-from-a-gaggle-of-virtual-assistants/