所有語言
分享
來源:36氪神譯局
圖片來源:由無界 AI生成
編者按:人工智能技術的發展日新月異,有很多人工智能領域的初創公司脫穎而出。在本文中,讓我們看看紅杉資本和凱鵬華盈等公司的投資者選擇了哪些有前途的人工智能初創公司。本文來自編譯,希望對您有所啟發。
如果你只有幾分鐘的空閑時間,那麼以下是投資者、經營者和創始人應該了解的關於人工智能最令人興奮的初創公司。
人工智能是今年科技故事的主線。自上一期“What to Watch in AI”系列報道以來,該領域不斷吸引資本、人才和關注度。當然,並非所有的關注都是积極的。儘管人們對這項技術的能力普遍感到興奮,但在過去的四個月里,業內重量級人物表達了他們的擔憂,監管機構也開始設計一些防範措施。在接下來的幾個月和幾年裡,人工智能將對我們的生活產生全面的影響,並在全球範圍內產生新的贏家和輸家。
我們的“What to Watch”系列旨在幫助讀者為即將到來的時代做好準備,更清楚地預見未來。對於那些希望了解人工智能前沿湧現的技術,並利用正在發生的變革的人來說,這是一個很好的起點。為此,我們邀請了人工智能領域最令人印象深刻的投資者和創始人,介紹他們認為最有前途的初創企業。
用人工智能來改善體外受精技術
在任何生育過程中,都有需要人類決策的時刻,其中與試管嬰兒最相關的兩個環節是“卵巢刺激”和“胚胎選擇”。
“卵巢刺激”指的是確定患者接受的藥物劑量,以刺激卵巢中卵泡的生長,以及何時進行觸發注射,刺激卵泡釋放卵子。注射觸髮針的時機至關重要,太早的話,你可能會得到不成熟的卵子;太晚的話,你可能會得到太成熟的卵子,或者得不到盡可能多的卵子。
“胚胎選擇”是指選擇使用和植入哪個受精卵。目前,臨床醫生和胚胎學家與大多數醫學專家一樣,會結合自身的經驗和培訓、形態學分級系統以及反覆試驗來決定。如果在一個周期中劑量或時間不合適,他們會在下一個周期中進行調整。這對醫生專業能力的要求非常高,而在這一點上,醫生們水平參差不齊,且他們的技術對結果非常重要。對於生育這個供應嚴重受限的市場來說,這意味着高昂的價格,尤其如果你想看到最佳結果的話。
Alife在構建人工智能工具,來改善體外受精(IVF)結果。該公司通過人工智能工具,利用大量的輸入和結果數據集,為從業人員提供“超能力”,以增強他們的決策準確度。現在,通過一個簡單的界面,醫生就可以輸入患者的特徵,並在生育過程中的關鍵時刻獲得精確的建議,這些建議來自之前數千個周期的結果。這些數據集來自已經存在的大量患者信息,並且隨着每位患者使用Alife產品,這些數據集會變得更好。
這些工具將改變生育行業的本質。Alife的研究表明,他們的機器學習模型可以幫助醫生優化50%的觸發時機,並幫助平均多取三個成熟卵子、兩個受精卵和一個胚胎。Alife 的產品可以大大拓寬不孕不育治療的渠道,通過降低所需藥物劑量和提高試管嬰兒周期的成功率,來降低每位患者的成本。這還將使醫生的競爭環境變得更加公平,使那些缺乏第一手經驗的人能夠獲得更廣泛的知識和信息。
最終,你可以想象 Alife 的工具可以為一個過程中的判斷時刻提供所有信息,並允許醫生以外的從業人員進行操作,從而顯著改變該行業的成本結構和可用性。更重要的是,數據驅動的精準醫療會通過個性化建議來增強(或最終取代)一個人的判斷,這並非試管嬰兒領域所獨有。在整個醫學領域,這樣的時刻成千上萬,我們有機會利用數據極大地改變關鍵程序和治療的結果和可及性。
——麗貝卡·卡登(Rebecca Kaden),聯合廣場投資公司(Union Square Ventures)普通合伙人
企業搜索
在工作中,當你需要的時候,準確找到所需信息應該是快速而簡單的。由於每個人在完成工作時都會使用大量的應用程序,並由此產生大量的數據和文檔,因此情況並非總是如此。隨着“知識”的指數式增長和工作性質的日益分散,查找現有知識所需的時間也越來越長。換句話說,在工作中“搜索東西”是相當困難的。
為了幫助僱主解決這個問題,阿爾溫德•賈殷(Arvind Jain)和他的團隊建立了一個基於人工智能的工作場所統一搜索平台Glean。它為員工配備了一個直觀的工作助手,幫助他們準確地找所需信息,並主動發現他們應該知道的信息。
該公司的使命從一開始很簡單:幫助人們更快地找到所有職場問題的答案,減少挫敗感和時間浪費。但後來公司的成果卻遠遠超出了搜索的範疇。舉例來說,Glean 不僅能搜索所有的工作場所應用程序和知識庫(Slack、Teams、Google Drive、Figma、Dropbox、Coda 等),還能理解自然語言和上下文,根據人們的角色和公司內部/外部關係個性化用戶交互。它能智能地显示公司最受歡迎和經過驗證的信息,幫助你發現團隊所了解的信息,並保持一致,而且所有這一切都是以權限的方式進行的。
隨着組織變得越來越分散,知識也變得越來越碎片化,像 Glean 這樣的直觀工作助手不再是錦上添花,而是提高員工工作效率的關鍵工具。該公司的發展將打破阻礙進步的藩籬,創造更积極、更富有成效的工作體驗。
此外,Glean 的搜索技術使其能夠在遵守企業嚴格權限和數據管理要求的同時,將生成式人工智能帶入工作場所。如今,阻礙企業將人工智能應用交付生產的主要障礙之一是,它們無法實施適當的治理控制。通過將實時數據權限插入企業的內部環境,Glean 已成為幫助企業大規模解決治理問題的理想解決方案,並讓企業可放心地利用其內部數據進行模型訓練和推理,從而發揮企業級人工智能數據平台/向量存儲的作用。
隨着時間的推移,我們相信每家公司都將擁有自己的人工智能版本,以了解業務和員工的細微差別。我們相信,Glean 公司正在抓住這一機遇。
——喬什·科因(Josh Coyne),凱鵬華盈(Kleiner Perkins)合伙人
多模態數據的存儲和管理
我們都玩過 Midjourney,而且大多數人都看過 GPT-4的演示。Midjourney (文本到圖像) 和 GPT-4 (圖像到文本/代碼) 說明了當模型變得多模化時,在文本、圖像和音頻等不同形式的媒體之間架起橋樑的可能性。雖然目前的人工智能熱潮大多圍繞着基於文本的模型,但多模態模型才是建立更準確世界表徵的關鍵所在。
隨着我們在機器人、醫療、製造業、娛樂和廣告等行業掀起下一波人工智能應用浪潮,越來越多的公司將在多模態模型的基礎上進行構建。Runway和 Flair.ai 等公司就是各自領域新興領導者的典範,它們的產品已獲得大量用戶需求,而谷歌等現有公司也已開始發布類似的多模態功能。
但是,使用多模態模型會帶來一個挑戰:如何存儲和管理數據? Parquet 等傳統存儲格式並沒有針對非結構化數據進行優化,因此大型語言模型團隊在數據加載、分析、評估和調試時都會遇到性能緩慢的問題。此外,由於缺乏單一事實源,大型語言模型工作流在一些細微之處更容易出錯。Lance 是最近出現的一家應對這一挑戰的公司。Midjourney 和 WeRide 等公司正在將 PB 級數據集轉換為 Lance 格式,與 Parquet 和 TFRecords 等傳統格式相比,其性能有了顯著提高,而且增量存儲成本也降低了一個數量級。
Lance並沒有止步於存儲,他們已經認識到需要重建整個數據管理堆棧,以更好地適應我們正在邁向的世界,在這個世界里,非結構化、多模態數據將成為企業最寶貴的資產。他們的首個平台產品 LanceDB(目前處於內測階段)為希望在其應用程序中構建多模態功能的開發人員提供了無縫嵌入式體驗。
Lance 只是公司將開發人員帶入多模態未來的一個例子,我非常期待看到其他技術的出現,以推動多模態應用的發展。隨着人工智能的發展,用不了多久,這樣的未來就會成為現實。
——薩爾州·古爾(Saar Gur), CRV 普通合伙人
遏制人工智能強化的網絡攻擊浪潮
對於生成式人工智能,我是一個毫不掩飾的樂觀主義者,但在這個問題上並不天真。例如,我擔心“社會工程”攻擊(如魚叉式網絡釣魚)的激增,這種攻擊通常使用电子郵件提取敏感信息。自去年 ChatGPT 爆紅以來,這種攻擊的發生率急劇上升。
根據 Abnormal Security 的數據,在過去的一年裡,每千人受到的攻擊次數從不到 500 次猛增到超過 2500 次。攻擊的複雜程度也在急劇上升。就像任何學生都可以用 ChatGPT 寫出一篇完美的作文一樣,ChatGPT也可以被用來發送語法完美、危險的個性化欺詐信息。
據聯邦調查局稱,自2013年以來,這種有針對性的“商業电子郵件泄露”攻擊已造成超過500億美元的損失。而且情況還會變得更糟。每天都有數不清的網絡犯罪分子和其他壞人利用“WormGPT”這樣的黑帽工具(這是一種聊天機器人,旨在挖掘惡意軟件數據,以策劃最有說服力、最具規模的欺詐活動)來進行欺詐活動。
幸運的是,Abnormal的聯合創始人埃文·瑞瑟(Evan Reiser)和桑傑·賈亞庫瑪(Sanjay Jeyakumar)正在努力使用人工智能來對抗這種威脅。你可以把這想象成是用AI來對抗AI。從歷史上看,电子郵件安全系統會掃描已知不良行為的特徵,比如特定的IP地址或試圖訪問個人身份信息(PII)的行為。
利用人工智能的力量,Abnormal顛覆了這一切。由於在人工智能的加持下,很多攻擊看起來是合法的,因此 Abnormal 的方法是充分理解已知的良好行為,即使是細微的偏差也會被察覺。該公司使用大型語言模型來構建其数字內部和外部運作的詳細表徵,例如哪些人通常會相互交談,以及他們可能會圍繞哪些內容進行互動。如果我的合伙人里德·霍夫曼(Reid Hoffman)給我發了一封电子郵件說:“嘿,請給我發 Inflection.AI 的最新資料。”Abnormal的人工智能引擎很快就會發現,里德很少以“嘿”開頭,也很少發送單句,而且他從來沒有要求我給他發送過有關 Inflection.AI 的文件。(作為公司的聯合創始人和董事會成員,他比我有更多的機會接觸這些文件!)。
毫不奇怪,隨着對生成式人工智能的安全擔憂不斷增加,Abnormal 公司的企業客戶需求也在加速增長。我認為 Abnormal 的成功非常令人欣慰,因為它能如此迅速地利用人工智能來應對因人工智能而加速的問題。在顛覆性技術變革時期,不良行為者往往享有漫長的先發優勢。畢竟,他們可以利用創新,而不必擔心產品質量、安全性或尚未制定新法律的監管機構。
與此同時,可以理解的是,科技初創公司正專註於為其創新開發強大的新用例,而不是阻止非法或破壞性的創新。但就像所有與人工智能有關的問題一樣,濫用人工智能可能造成的網絡破壞也是驚人的。由於Abnormal團隊的先見之明,網絡犯罪的新常態可能至少會變得不那麼容易發生。
——薩姆·莫塔梅迪(Sam Motamedi), Greylock 公司合伙人
增強知識工作者的能力
很明顯,大型語言模型將提高知識工作者的效率。但目前尚不清楚具體會如何做到。Dust 正在努力弄清這個問題。如果知識管理者不能訪問企業內部數據,那麼他們在企業中就幫不上什麼忙。因此,Dust建立了一個平台,對企業的內部數據(Notion、Slack、Drive、GitHub)進行索引、嵌入和實時更新,並將其公開給大型語言模型支持的產品。
Dust 聯合創始人加布里埃爾•休伯特(Gabriel Hubert)和斯坦尼斯拉斯•波盧(Stanislas Polu)將一家公司賣給了 Stripe,並在那裡工作了5年。他們親眼目睹了快速增長的公司如何在規模問題上作鬥爭的。他們親眼目睹了所謂的“信息債務”,而現在他們正專註於應用大型語言模型來解決與之相關的一些主要痛點。目前,Dust 正在其平台上探索以下應用:
雖然內容繁多,但 Dust 的創始人相信,這些數據流中的大部分最終都將匯聚成一個統一的產品。他們仍處於探索的早期階段,正在形成 Dust 的最終圖景。根據初步迭代,他們相信已經證實了自己的核心假設:知識工作者的能力可以通過大型語言模型得到增強(而不是取代),並且可以基於此構建一種新的‘團隊操作系統’。
——康斯坦丁·布勒(Konstantine Buhler),紅杉資本合伙人
釋放業務數據
“大數據的興起”已經持續了20多年,儘管企業在不斷攝取比以往更多的數據,但許多企業仍然難以利用這些數據從人工智能模型中獲得洞察力。數據處理和解釋仍然是人工智能過程中最繁瑣、最昂貴的部分,但也是對高質量結果最重要的部分。即使預先訓練的大型語言模型有所增加,但企業依舊需要專註於使用自己的專有數據(跨多種模態)來創建具有獨特優勢的生成式人工智能,從而提供差異化的服務和洞察力,並提高運營效率。
Labelbox 簡化了企業將數據集輸入人工智能模型的方式,從而解決了這一難題。它可以幫助數據和機器學習團隊找到正確的數據,對其進行處理和解釋,將模型推嚮應用,並持續測量和改進性能。
Labelbox的新平台利用了生成式人工智能的優勢。Model Foundry允許團隊快速試驗來自所有主要封閉和開源提供商的AI基礎模型,使他們只需點擊幾下就能預先標註數據並快速進行試驗。這樣,他們就能了解哪種模型在其數據上表現最佳。Model Foundry 可為每次實驗運行自動生成詳細的性能指標,同時對結果進行版本控制。
其影響可能是深遠的。傳統上,人類需要花費數天時間來完成一項簡單但耗時的任務,比如對包含多段文本的电子商務列表進行分類。而有了 GPT-4,這項任務可以在數小時內完成。Model Foundry 可以讓企業自己發現這些高效的方式。
這並不是唯一的例子。早期的結果表明,超過88%的標註任務可以通過一個或多個基礎模型進行加速。Labelbox 可以讓任何人只需點擊幾下,就能對數據進行預標註,而無需編碼和將數據輸入模型。這個工具旨在增強團隊協同工作的能力,並利用跨職能的專業知識來維持對數據質量保證的人工監督。這一功能允許語言模型專家和中小型企業輕鬆評估模型、豐富數據集併合作構建智能應用程序,從而實現人工智能訪問的大眾化。
事實證明,Labelbox 為沃爾瑪、寶潔、基因泰克和 Adobe 等全球最大的企業顯著降低了成本,提高了模型質量。
對於企業來說,如何在其專有數據上釋放這些基礎模型的力量,以解決業務問題,現在是一場競爭。我們期待看到 Labelbox 將如何幫助企業釋放數據,以更高的效率提供更好的產品。
——羅伯特•卡普蘭(Robert Kaplan),軟銀合伙人
全新的創意套件
人工智能無處不在,並日益成為一種商品。在大多數情況下,公司將人工智能作為聊天機器人來豐富現有的應用程序。很少有人工智能應用重塑產品體驗,利用這項技術從根本上改變我們與產品的互動方式,就像谷歌的搜索引擎改變了我們瀏覽互聯網的方式,或者Instagram改變了我們從手機上分享照片的方式一樣。這些人工智能應用需要深刻理解現有的用戶體驗、有遠見的產品思維和前沿技術。
Runway就是這樣一家公司的領先範例,它利用應用人工智能研究來重新構想創意體驗,並建立了一個全新的創意套件。
自2022年10月以來,Runway已經開發了30多個AI“魔法工具”,涵蓋視頻、圖像、3D和文本,服務於創作過程的各個方面,從前期製作到後期製作。他們的客戶群包括財富500強和全球2000強公司,如哥倫比亞廣播公司的斯蒂芬·科爾伯特晚間秀(The Late Show with Stephen Colbert)、新百倫(New Balance)、Harbor Picture Video、陽獅(Publicis)和谷歌(Google)。該平台還被用於剪輯奧斯卡提名影片,如好萊塢熱門影片《瞬息全宇宙》(Everything Everywhere All at Once)。
最令人興奮的人工智能應用改變了現有的產品體驗,重新思考了用戶與產品的交互方式。有了 Runway,用戶可以在幾秒鐘內完成新的視頻創作,無論他們是第一次拍攝視頻還是專業製作工作室。這是一個革命性的轉變,也是人工智能如何重塑不同行業的一個例子。
——格蕾絲·伊斯福德(Grace Isford),萊克斯資本(Lux Capital)合伙人
重塑細胞命運
細胞是地球上最複雜的計算機系統。就像電腦芯片一樣,DNA也是由基本單元組合而成的,從而產生複雜的功能。與基於“位”的代碼不同,基於原子的代碼具有隨機性和分層性。一個系統依賴於另一個系統,而另一個系統又依賴於其他物理系統,每一個系統都受到熱量、酸度和細胞微環境中分子的影響。
儘管存在這些相互依存的關係,但細胞機器代碼(DNA)依舊可以有效地運行不同的程序。儘管你的肝細胞和皮膚細胞含有相同的基因組,但這些細胞類型的外觀、感覺和功能都不同。為什麼?因為它們在執行不同的表觀遺傳程序。
2006年,高橋(Takahashi)等人使用四種轉錄因子(TF)蛋白組合將成熟細胞重編程為干細胞,開創了表觀遺傳重編程領域。轉錄因子是一種蛋白質,可以調節基因,本質上是改變正在運行的“程序”。高橋和山中(Yamanaka)的發現促成了誘導多能幹細胞(iPSCs)的誕生,並獲得了諾貝爾獎。此後,許多研究小組開始應用獨特的TF組合來改變細胞狀態,使受損細胞恢復活力,並恢復年輕的細胞表型。
雖然表觀遺傳重編程變得更容易處理了,但這仍然不是一件小事。研究小組必須分辨哪種TF組合能有效地將細胞從A狀態轉變為所需的B狀態。例如,未來的TF組合可能會讓我們把患病細胞轉變為健康細胞,從而開發出一類新葯。我們需要超大規模的重編程篩選,因為許多應用領域還不知道TF的確切組合。人類原生 TF 超過 1,500 種,因此需要一種更有效的搜索方法。我們相信,NewLimit 正在設計這樣一種方法。
在單細胞測序和機器學習技術進步的推動下,NewLimit正在將以前的手工學科轉變為數據驅動的科學。該公司在分子生物學家和計算生物學家之間有一個健康的分工,為構建一個越來越高效的閉環平台奠定了必要的文化基礎。結合專業知識和多模態讀數(scRNA-Seq、scATAC-Seq等),NewLimit 的目標是發現治療性重塑因子,以治療以往難以治癒的疾病。
在每一輪實驗中,NewLimit都會使用機器語言技術來:
除了出色的團隊、技術實力和雄心勃勃的願景外,我們還欽佩NewLimit的務實精神。雖然該公司尚未公開分享其最初商業戰略的細節,但我們相信這種方法是創造性的,合理地降低了風險,並可能為人類帶來變革。創始團隊一致認為,平台生物技術可能被比作昂貴的科學項目,而不會產生短期資產。為此,NewLimit 公司自成立以來一直保持透明,並對其技術進展進行了編目。
我們應該對大自然的複雜性感到謙卑。可以肯定的是,生物學比我們自己設計的硅器件更難編程。Dimension 的目標是幫助像 NewLimit 這樣的創業先鋒,讓他們能夠在技術和生物學的交界處探索可能性的邊界。
——西蒙·巴尼特(Simon Barnett), Dimension研究總監
用於軟件開發的基礎人工智能
OpenAI專註於通用人工智能,DeepMind專註於科學發現,而人工智能的第三個基本用例是理解和創建軟件。
GPT-4在經驗豐富和新手開發人員的工作流程中根深蒂固。但這種模式轉變仍處於起步階段。從過去幾個月的情況推斷,人工智能輔助編程將很快變得無處不在。隨着這一趨勢進一步發展,自然語言將成為構建軟件的抽象基礎。
雖然其他公司也發布了類似 StarCoder 這樣的大型純代碼模型,但還沒有任何一種方法的性能接近 GPT-4。我認為這是因為只對代碼進行訓練的模型無法產生強大的軟件開發能力。我就是這樣認識 Poolside 的。這家公司由 GitHub 的前首席技術官傑森·華納(Jason Warner)和 source{d} 的前創始人艾索·康德(Eiso Kant)創立,source{d} 是世界上第一家研究代碼人工智能的公司。
Poolside 的獨特之處在於,他們採用了OpenAI基礎模型方法,但只關注於一種功能:代碼生成。他們的技術戰略取決於代碼可以被執行這一事實,從而在學習過程中獲得即時和自動的反饋。這使得通過代碼執行進行強化學習成為可能,與基於人類反饋的強化學習(RLHF)相比,這是一個令人信服的替代方案。這是艾索早在2017年就開始探索的事情。
雖然通用人工智能(AGI)造福人類的潛力不可否認,但它的實現仍然很遙遠。那麼,為什麼要等待AGI呢?通過專註於推進人工智能的特定領域,比如軟件開發,我們可以拆除更多的創造障礙。我很期待 Poolside 團隊有朝一日能夠實現建立專用軟件基礎模型的願景。
——馬坦·格林伯格(Matan Grinberg), Factory聯合創始人兼首席執行官
法國的 OpenAI 競爭對手
最近,生成式人工智能領域項目的爆炸式增長照亮了巴黎。或許你會問為什麼?我的想法是,巴黎擁有生成式人工智能領域最大的世界級人才庫,而這些人才還處在 OpenAI 的事件視界之外。在這些項目中,最大膽的無疑是 Mistral。Mistral 是由紀堯姆·藍珀(Guillaume Lample)、亞瑟·門施(Arthur Mensch)和蒂姆特·藍科若西(Timothe Lacroix)創立的,其使命是建立最好的開源語言模型,目標是圍繞這些模型建立一個繁榮的生態系統。
我認識紀堯姆已經四年了,我們都在深入研究將大型語言模型應用於數學領域,尤其是形式數學。在 OpenAI 和 Meta 工作期間,我們建立了友好的競爭關係。紀堯姆是我有幸共事過的最有才華的研究人員之一,我有幸見證了他從在 Meta 從事研究到創立 Mistral 的過程。在這個過程中,我還結識了亞瑟·門施(Arthur Mensch)。他的工作一直給我留下了深刻印象,尤其是 Chinchilla,它重新定義了高效訓練大型語言模型的含義,還有 RETRO,一種檢索增強語言建模的方法,要我說,這種方法仍然沒有得到充分的探索。
現在,讓我們深入探討一下 Mistral 之所以成為 Mistral 的原因。這家初創公司的願景是建立一個以一流開源模型為基礎的生態系統。這個生態系統將成為項目、團隊和公司的啟動平台,加快創新和創造性使用大型語言模型的步伐。
以基於人類反饋的強化學習(RLHF)為例。通常,進行 RLHF 需要耗費大量時間,因此成本也很高。它涉及人工智能行動的手動“標記”,這可能需要大量的工作。只有當人工智能模型的前景足夠好時,這種努力才是值得的。對於像 OpenAI 這樣的大型企業來說,在這一過程中進行投資是有意義的,公司有足夠的資源來實現這一目標。但傳統的開源社區通常需要一個“領袖”站出來,承擔起這一重任。
Mistral有機會做到這一點,投資在開源模型上進行RLHF。通過這樣做,Mistral 將為創新的寒武紀大爆發打開大門。開源開發者將有機會獲得標籤清晰的模型,他們可以根據不同的需求對其進行調整和定製。最終的贏家將是更廣闊的市場,我們將有機會獲得比一家封閉公司單獨產生的更具體、更引人注目的用例。
誰擁有最好的開源模型,誰就更能吸引人們的興趣和價值。我看好 Mistral,因為該團隊正在积極推動效率/性能前沿的發展。同時,Mistral 在這方面的人才也是迄今為止全球最優秀的。
Mistral已經確保了團隊和資源來執行這個最初的願景。公司還找到了合作夥伴,在企業級用例中對這些模型進行評估。請密切關注 Mistral 公司,他們已經準備好與 OpenAI 一決高下了。
——斯坦尼斯拉斯·波盧(Stanislas Polu), Dust 聯合創始人
更智能的工業機器人
我們經常聽到有人預測,從長遠來看,人工智能和機器人技術將增強人工任務或使其自動化。如今,這已日益成為一項緊迫的商業任務。
到2030年,歐洲適齡勞動人口預計將減少1350萬,勞動力成本正以20多年來最快的速度上升。隨着电子商務的興起,倉庫的壓力比以往任何時候都要大,對企業來說,保持競爭力變得越來越具有挑戰性。
倉庫運營費用的55%來自訂單揀選,但對於希望轉向自動化系統的公司來說,情況不容樂觀。我們所熟知的以人工智能為先導的 SaaS(軟件即服務)中的各種華而不實的應用程序,或者我們在生態系統的其他部分所看到的大量開源產品,都還沒有應用到機器人領域。
相反,尋求自動化揀選和包裝的企業面臨着選擇昂貴、不靈活的機器人解決方案。他們必須駕馭大量的專有接口,這些接口需要大量的編程時間和專業知識。這些系統還難以應對不斷變化的產品組合,需要定期的人工干預,並且在處理極端情況時表現不佳。
Secret解決了這些難題。它的軟件以強大的模擬環境為基礎,訓練机械臂理解任何潛在實際環境的空間和物理細微差別。部署后,系統將通過不斷學習真實世界的數據進行優化。這也意味着它們可以應對抓取电子設備、紡織品、水果、瓷磚和木材等傳統高難度物品的挑戰。
最令人興奮的是,他們的機器人堆棧使用大型語言模型來實現對機器人的直觀自然語言控制。他們開發了一種名為“PickGPT”的轉換器模型,允許用戶通過語音或文本向機器人發出指令和反饋。這樣,無論技術知識水平如何,任何人都可以要求機器人執行所需的任務。
Secret 結合了其聯合創始人的兩個專業領域。首席執行官拉爾夫·古爾德(Ralf Gulde)在人工智能和機器人技術的交叉領域進行過研究,而首席技術官馬克·圖舍(Marc Tusher)則專門研究深度學習。兩人在斯圖加特大學(University of Stuttgart)開展了這些學科的同行評議研究,斯圖加特大學是德國最負盛名的自動化和工業製造大學之一。
儘管是一家年輕的企業,但 Sereact 已經吸引了眾多令人印象深刻的合作夥伴,其中包括戴姆勒卡車公司(Daimler Truck)、施邁茨公司(Schmalz)、Zenfulfillment 公司、齊默集團(Zimmer Group)和 Material Bank。這表明在揀選和打包行業有巨大的潛在市場機會。
除了在电子商務倉庫中的明顯應用場景(無論是揀選訂單還是拆箱)之外,還有一系列其他用例。例如,在傳統製造業中,有一個耗費時間的過程,即裝配,其中包括費力地收集裝配所需的精細部件。一直以來,機器人手臂都很難抓取小部件,也很難在雜亂無章的環境中分揀出單個部件。Sereact 的軟件可以識別這些部件,並選擇正確的抓手將其抓取出來。
Sereact 團隊不僅擁有高超的技術,而且對客戶的工作環境有着敏銳的理解,並真正希望幫助客戶克服勞動力短缺問題,實現高效、持續的運營。作為第一個將大型語言模型和拾取打包的結合,從學術上的可能性轉變為現實影響的公司,我對他們執行和擴展真正機器人挑戰者的能力充滿信心。
——內森·本艾池(Nathan Benaich),Air Street Capital普通合伙人
量身定製的大型語言模型引擎
現在,每個企業都在嘗試將人工智能融入到公司的業務中。世界上最大的公司都認識到了人工智能的潛力,標準普爾500指數中有20%的首席執行官在第一季度財報電話會議上提到了人工智能。大型語言模型可以通過加速客戶支持、對外銷售和編碼等核心功能,顯著提高業務效率。大型語言模型還可以通過基於人工智能的助手來回答客戶問題,從而改善核心產品體驗,或創建全新的生成式人工智能工作流程來讓客戶滿意。
鑒於大公司在採用新技術方面往往比較滯后,所以我們對企業開始使用人工智能進行構建的速度之快感到驚訝。不足為奇的是,許多企業希望在內部建立自己的人工智能模型和解決方案。每個企業都有一個專有客戶數據寶庫,且通常是其核心業務護城河的一部分。這些企業認為,將其最有價值的數據發送給基礎模型 API 或可靠性不確定的新創公司存在風險。即使不考慮數據隱私問題,GPT-4 或 Claude 等公共大型語言模型也完全是基於開放數據進行培訓的,因此缺乏針對企業特定用例和客戶群的定製功能。
一些科技公司,如Shopify和Canva,已經在內部組建了“人工智能老虎隊”,利用現成的開源模型,將人工智能融入到業務的各個部分。然而,大多數公司沒有資源或經驗豐富的人工智能研究人員來基於自己的數據構建和部署專屬大型語言模型。他們意識到這波人工智能浪潮可能是業務未來的轉型時刻,但到目前為止,還無法利用或控制自己的人工智能開發。
這就是為什麼我們對莎倫·周(Sharon Zhou)和格雷格·第阿莫斯(Greg Diamos)及其團隊在 Lamini 所做的事情感到非常興奮。Lamini是一個大型語言模型引擎,可以使開發人員輕鬆地快速訓練、微調、部署和改進自己的模型,並提供人工反饋。這款工具提供了一種令人愉快的開發體驗,抽象出了人工智能模型的複雜性,更重要的是,允許企業在自己的數據之上構建人工智能解決方案,而無需雇傭人工智能研究人員或冒着數據泄漏的風險。去年秋天,我們首次與莎倫和格雷格合作。從那時起,我們就有機會為這個技術精湛、客戶至上的創始團隊提供支持,幫助他們實現雄心勃勃的願景,改變企業採用人工智能的方式。
具體來說,與使用公共解決方案相比,使用Lamini部署私有大型語言模型提供了廣泛優勢。內部工程團隊處理構建過程可確保數據隱私,並在模型選擇以及整個計算和數據堆棧方面具有更好的靈活性。與現成的 API 相比,使用 Lamini 製作的模型還能減少幻覺、降低延遲、確保可靠的運行時間和更低的成本。這些性能增強來自Lamini團隊基於數十年的研究,以及圍繞AI模型和GPU優化的行業經驗,而構建到產品中的核心技術見解。
知名初創公司和大型企業已經開始使用Lamini在內部和客戶中部署大型語言模型了,他們對其設置速度、性能和可靠性感到非常興奮。在未來,我們相信每個企業都會在其業務和產品中使用AI,但只有少數企業會有專門的AI團隊。Lamini這家初創公司正在創造公平的競爭環境,幫助所有公司都能有機會利用這一變革性技術。得益於其最近與 Databricks 的合作,企業現在可以比以往任何時候都更容易地在現有的Databricks數據湖和計算集群上直接設置Lamini,從而啟動和運行他們的人工智能解決方案。
——詹姆斯·吳(James Wu), First Round Capital投資人;托德·傑克遜(Todd Jackson),First Round Capital合伙人
你的編碼“機器人”
當下,如果你想讓計算機為你做一些事情,就必須將自己的想法轉化為“計算機語言”,一種編譯器能夠理解的超文字代碼。要想成為一名工程師,就必須像機器一樣扭曲大腦思維。但是,我們正在到達一個轉折點,人工智能可以將人類語言轉化為代碼。從人類工程師到数字工程師的轉變,很有可能成為我們一生中最重要的技術拐點之一。
我們仍處於這種轉變的初級階段。BabyAGI 和 AutoGPT 等人工智能工具激發了公眾的想象力。但是,儘管像 Github Copilot 這樣的編碼助手代表了一種進步,但它們仍然非常有限,其作用主要是為已經在代碼中實現的想法進行自動補全。
Factory則是不同的。該公司由前弦理論家馬坦·格林伯格(Matan Grinberg)和機器學習工程師埃諾·雷耶斯(Eno Reyes)於2023年創立。當我見到馬坦時,立刻被他的願景所吸引了:在未來,工程師們可以將惱人的任務下放,專註於棘手的難題,從而使構建事物充滿樂趣。為此,馬坦和埃諾創造了自主編碼“機器人”。
機器人是人工智能工程師,可以處理代碼審查、調試和重構等日常任務。與現有的產品不同,Factory 的機器人不需要你動手,它們可以獨立審查代碼、處理錯誤和回答問題。你也可以像初級開發人員一樣使用機器人,利用它們進行頭腦風暴並分擔功能工作。機器人擁有強大的防護機制,它們的智能是以用戶需求為目標的,不易“幻覺”出錯誤答案。
代碼生成將成為人工智能革命中最具變革性的領域之一,而 Factory擁有成功的所有必要工具。
人類發展的故事是一個卸載重複性工作的故事,這讓我們能夠轉向更複雜的任務。當人類發明農業時,實際上是釋放了我們建造城市的能力。在工業革命之後,我們製造了能把人類帶到月球上的火箭。下一代的任務是將人類從網上的苦差事中解放出來,進一步推動技術前沿。
當唯一的限制是人類的想象力時,我們下一步將建造什麼?
——馬爾基·瓦格納(Markie Wagner),德爾福實驗室(Delphi Labs)創始人兼首席執行官
譯者:Jane