所有語言
分享
你是如何召喚蘋果手機的語音助手Siri的?
已經12歲高齡的Siri,它主要提供了三個類型的“輔助功能”。
1、調動聲音、鬧鐘、備忘錄等系統基礎應用的控制能力。比如:Hi Siri,明早兩點我有個2億美金的合同要簽,記得提醒我。
2、調用第三方軟件。比如:Hi Siri,發微信給林志玲,我想約他一起看《熱烈》。
3、聯網搜索:比如:Hi Siri,今天晚飯想簡單點,幫我看看,澳洲香檳蟹怎麼做好吃?
Siri自誕生以來就被貼上了智能語音助理的標籤,但它的定義更應該是自然語義處理工具,僅具有語音識別和語義理解能力,然後把理解的指令去調用手機應用。
說實話,Siri的功能挺雞肋,會用,但頻率不高。
chatGPT+Siri,會不會等於鋼鐵俠的賈維斯?或者士官長的科塔娜?
這個答案是肯定是,大語言模型的加持勢必會讓第一代AI助理,包括像蘋果Siri、微軟Cortana、亞馬遜Alexa、GoogleAssistant等等,帶來一次巨大的性能飛躍。
更好的自然語言的理解處理和推理反饋,加上語音識別,這才是人們夢寐以求的AI語音助理!
說道AI語音助理,第一想到的肯定是Siri,實際上,每個手機品牌都有自己的語音助理。小米的小愛同學,華為的小艾,三星的Bixby。
今天,我們就來看看,在這一次的AI浪潮里,這些手機廠商們會如何升級語音助手這個功能。
Siri進入蘋果生態是在iPhone4S的發布會上,那是2011年。在當時的介紹視頻里,Siri的介紹時間佔據了影片的20%,充分展示了Siri強大的助理能力以及在當時十分前衛的交互操作。
10年過去了,Iphone更換了好幾部,Siri還是那個Siri……
Siri會擁抱大語言模型嗎?過去一年,公眾對蘋果進軍這一領域充滿期待,但蘋果的表現卻極其謹慎,以至於被認為是落伍了。
最近,《華爾街日報》等媒體透露,蘋果已經建立了自己的大語言模型框架“Ajax”,並已經將其應用在地圖、Siri等功能上。蘋果還基於Ajax創建了一個聊天機器人服務,一些工程師稱之為“蘋果GPT”,類似於chatGPT。
因而,完全有理由相信,Siri的大升級,肯定回來,但又不會太快。從蘋果少之又少的介紹中就能看出一二。這也不難理解,相比於一些創業公司的激進做法,比如向公眾開放Beta測試版之類,蘋果要慎重得多,在面向市場階段,他們會更希望提供一個可靠和穩定的版本。
三星的語音助手是Bixby,誕生於2017年。三星有沒有想讓它擁有chatGPT的能力?答案是肯定的。
7月,三星副總裁兼全球產品規劃總監 Junho Park 提到了生成式 AI 技術的發展,他有暗示 Bixby 將獲得生成式人工智能功能。但是,三星到底如何提升Bixby的功能,三星表現得非常謹慎,鮮有相關的計劃和內容披露。
非常有意思的一點, 與手機相比,科幻電影里人類助理的交互方式或許更適合的硬件是耳機。Junho Park說,“無線耳機是一種很好的溝通方式。它不需要任何屏幕,因此是生成人工智能的好地方。”
可以確定的是,三星正在积極探索將生成式人工智能融入其 Galaxy 產品的方法。這不僅包括智能手機,還包括智能手錶、耳機、平板電腦。
小米在AI方面的團隊人數據說超過了1200人,而雷軍在4月份更是發微博說,小米對大模型會全力以赴。小米集團總裁盧偉冰更直接:小愛同學就是小米大模型落地的代表。
小米集團AI實驗室主任王斌在最近一次的採訪中稱,大模型最強的能力,簡單來說就是它更理解人,它顯然能優化人機交互的方式。小米的小愛同學、手機操作系統MIUI、汽車的座艙、IoT、機器人,都是應用大模型的典型場景。
絕對有理由相信,小愛同學一定會擁有類chatGPT的能力!不過,按照王斌的說法,天生帶着產品屬性,小米大模型會跟場景結合得更緊密,它會圍繞產品的節奏去做相應的發布規劃。
華為手機絕對是一眾主流手機廠商里最激進的玩家,在8月份的華為開發者大會上,華為常務董事余承東明確表示,華為的盤古大模型將賦能全新的語音助理小藝。
從介紹看,主要是幾方面的能力。
首先是交互,包括基於自然語言理解的設備控制,本機数字內容搜索,對話識別屏幕內容。這些其實與初代助理很相似,但語義理解能力是不是更強,還有待觀察。
其次是生產力,小藝可以幫助用戶快速摘要、文案內容輔助、圖片二次創作等等。在今年 P60 系列的發布會上,對小藝說“找一下去年在公園看煙花的照片”,它就能在圖庫找到對應照片。而打開一張海報,通過對話就能讓小藝直接識別海報中的活動地址,並啟動導航到目的地。
另外,直接發送資訊鏈接、文檔給小藝,對它說“這篇核心觀點是什麼”,它可以快速總結出要點,英文資訊也可以用中文進行摘要。
最後,chatGPT上最熱門的玩法,這個小藝似乎也可以,對着她說:“請寫一篇關於大模型技術研討的會議邀請函”,她就可以生成邀請函。
不得不說,很強大。這幾乎就是chatGPT了語音版本了,當然準確性是否能和chatGPT一較高下還未可知,但科技感是拉滿了。
不過,這些都是發布會展示內容,真正的開放測試將會在8月底,再晚一些,搭載 HarmonyOS 4.0 及以上的部分機型都可以升級。
圖片來源:由無界 AI生成
2021年,Siri橫空出世,它被寄予了厚望。但很快,它就成了用戶吐槽對象:確實能輔助用戶使用手機,提供操作便利,但它與智能助理之間的差距實在太大了。
十年來,Siri們不盡如人意,但今天,情況很明顯有變。語音助手毫無疑問是AI語言大模型的最佳切入口,藉助大模型似乎可以把語音助手從“智障”的境地帶出來,變成真正的AI語音助理。
它不僅幽默,還會和我們聊天,吐槽。
它甚至可以擁有自己的情感,自己的看法。
最好,它肯定會處理很多日常的事務,可以控制各種家用設備……
今天,從蘋果、三星、小米到華為,他們都對語音助手投入了很多關注,動作有快有慢,有的激進,有的謹慎。但無論如何,我們肯定就要迎來一個更智能的AI語音助理了。
就像人類一直想要飛一樣,人類追求AI語音助理的夢也是天生的。它完全就是科技發展的必然品:完成人類言語和机械直接的“溝通”。
有趣的地方或許在於,手機雖然是最佳的場景,但最後成功的一定是手機品牌嗎?AI智能助理可能壓根就不需要手機。