所有語言
分享
在 iOS 18.2 Beta 2 上,蘋果 Visual Intelligence(視覺智能)正式登場。
作為 Apple Intelligence 的一部分,Visual Intelligence 是 iPhone 16 系列上的「獨佔」功能。主要通過 iPhone 16系列上新增的相機按鈕,利用攝像頭捕捉物理世界的對象,並通過大模型分析有關該物體的「深度和有用信息」。
例如,拍攝餐廳的照片,用戶可以立即獲得其營業時間、評價和菜單等詳細信息;拍攝活動傳單的照片,該工具可以提取並整理重要詳細信息,例如活動的名稱、日期和地點。
Visual Intelligence 配合 iPhone 16 系列的相機按鈕,具有免解鎖、一鍵 AI 的特性,相對之前的 iPhone 或其他設備而言,具有更高效率。
基於 Visual Intelligence ,蘋果也為接下來的 AI、AR 眼鏡做了足夠的技術鋪墊、場景探索與用戶習慣的養成。Ray-Ban Meta 已經證明了 AI 眼鏡技術路徑的可行性,蘋果也於近日啟動了代號為「Atlas」的智能眼鏡項目,一場巨變正在醞釀。
相對文字形式,圖形圖像屬於典型的空間數據,是人們日常獲取信息最主要的方式。Visual Intelligence 的出現,讓這種信息獲取現在有了更数字化的方式。
海外媒體在 iOS 18.2 Beta 的評測信息显示,當 Visual Intelligence 界面打開時,只需點擊相機快門按鈕即可拍照。然後,用戶可以點擊屏幕上的按鈕向 ChatGPT 詢問圖片,也可以按搜索按鈕啟動 Google 搜索。用戶可以選擇在沒有帳戶的情況下使用 ChatGP;如果不登錄,請求將保持匿名。
從下方的三張圖中,分別展示了利用 Visual Intelligence 進行「識別物體」,「計算食物卡路里」,以及「提取重要信息」的場景,不管是利用「物體圖片進行檢索文字信息」,還是利用「圖片上的文字檢索更深度的圖片、文字信息」,Visual Intelligence 都能很好地給出答案。
不同的是,一些是顯而易見的基礎信息,一些是需要網絡數據的挖掘匹配,還有一些是需要持續對話進行挖掘。當然,這些取決於前置的 Prompt,如果有更完善的 AI 工作流設定,相信它會基於每種不同的物體,甚至不同的用戶,給出千人千面的答案。如:當識別圖片物體為「食物」時,自動去分析它的「卡路里」以及相關營養信息,而不僅僅是告訴我,它是什麼,將會進一步提升效率。
圖源:CNET
圖源:Future
圖源:Apple
雖然 Visual Intelligence 與 Google Lens,或者百度的 AI 識圖十分相似,但 Visual Intelligence 的與眾不同之處在於它直接在 iPhone 上處理所有內容,而不是將數據發送到雲端。
蘋果軟件工程高級副總裁 Craig Federighi 指出,Visual Intelligence 使用設備內處理技術結合蘋果自己的服務。這意味着用戶的照片將保持私密,不會上傳到外部服務器。
iOS 18.2 預計將於 12 月份第一周面向美國地區正式推送。Visual Intelligence 是一個非常高效率的工具,將帶來更好的 AI 交互提升與應用變革。
對於 AI 圖像圖形識別來說,目前智能手機無疑是最方便的电子產品,不過從交互維度來說,帶攝像頭的 AI/AR 眼鏡或是更好的載體,至少讓用戶可以空出雙手,不用一直握持 iPhone。
圖源:tomsguide
據外媒消息,有知情人士透露,蘋果於近日開啟了一項全新的內部研究,該研究重點聚焦於智能眼鏡的開發。
據稱,這個新項目的代號為 Atlas。蘋果收集了員工對於智能眼鏡的看法,負責該計劃的團隊也向部分選定的員工發送了电子郵件,以此確認了在這一領域的產品研究情況。
當蘋果計劃推出新的品類產品時,通常會組建秘密小組。公司傾向於收集員工而非客戶的反饋,目的在於保持計劃的保密性。這些情況充分表明,蘋果有意大力推進開發自己的智能眼鏡的想法。
值得注意的是,報道稱這項研究由蘋果硬件工程部門的產品系統質量團隊領導,其中並未提及蘋果的 Vision 部門,這意味着蘋果這款智能眼鏡是不帶光機的 AI 音頻眼鏡,與 Ray-Ban Meta 類似。結合早前蘋果決定推遲 AR 眼鏡的研發信息來看,具有較高可信度。
相對於 AR 智能眼鏡而言,AI 音頻眼鏡不僅技術門檻相對更低,且供應鏈也十分成熟,體積重量上也普遍能做到 50g 以內的輕薄佩戴體驗。不少業內人士認為 AI 音頻眼鏡是未來全彩 AR 眼鏡重要的過渡產品,在目前消費市場中具備較高的市場競爭力。
蘋果擁有一整套最強的生態聯動,正如 AirPods 與 iPhone 連接的高效率表現。蘋果如果將 AI 眼鏡定義為 iPhone 的「配件」,內置攝像頭與麥克風,利用 iPhone 的 AI 算力,連接 Visual Intelligence 與加強版 Siri,充分利用自身的硬件生態,那將會是一個更加驚艷的硬件。
在所有可穿戴設備中,AI 眼鏡擁有諸多先天產品設計上的優勢,可配備第一人稱視角的攝像頭,所見即所得;近嘴的麥克風,更好地拾音效果;近耳的揚聲器,更好地人機交互。可以說,目前蘋果在 iOS 上所儲備的 Visual Intelligence 與加強版 Siri 等 AI 技術都能在 AI 眼鏡上得到更好的實現。
一直以來,蘋果的消費級硬件都以「技術創新」和「場景創新」聞名,在 AI 眼鏡上,我們也可以期待一下,蘋果是否能做出一款真正超越 Ray-Ban Meta 的 AI 眼鏡產品,滿足一些額外的消費需求。
當然,與 Ray-Ban Meta 等第三方設備相比,從使用效率、連接體驗上來看,手機廠商自身的硬件生態組合本身就會有一些明顯優勢,即使前者具備先發優勢。
眼鏡品類在目前的消費市場的確是一個大眾產品,但也並非完完全全是一個生活「必需品」。對於無需近視矯正、戶外遮陽的用戶來說,佩戴眼鏡事實上是一件非常困難的事。就個人而言,在沒有養成眼鏡佩戴習慣之前,即使 20-30g 的眼鏡長時間佩戴也是一件非常困難的事,除非它真的能給我帶來價值增量,就像 AirPods 和 Apple Watch 那樣。
在古希臘神話中,Atlas(阿特拉斯)是擎天巨神,屬於泰坦神族,他被宙斯降罪用雙肩支撐蒼天。從命名上來看,蘋果對於這款硬件寄予厚望。然而,蘋果的 AI 眼鏡系列,能否真正支撐其蘋果智能穿戴、甚至計算平台的下一個十年呢?
答案留給時間。