全系標配滿級防水,OPPO A5 系列新品正式發布

幾秒鐘閃過的谷歌新眼鏡,是 AI 與 AR 最好的硬件載體 | Google I/O
谷歌眼鏡用上了 Meta 智能眼鏡的攝像頭,還有 Meta 準備在下一代增加的 AR 顯示功能,多模態 AI 助手的能力也更勝一籌
谷歌曾在 2022 年的 I/O 大會上展示過一款智能眼鏡,其本質是一款 AR 翻譯眼鏡,支持語音雙向翻譯、手語翻譯等功能,語音助手作為主交互界面,通過近眼顯示提供實時翻譯的字幕信息。
而在剛剛開幕的 Google I/O 2024 開發者大會上,又有一款智能眼鏡短暫亮相——短到只有幾秒,模樣被一帶而過,卻令人過目不忘。
谷歌新眼鏡是伴隨著新 AI 助理 Project Astra 的發布而亮相的。
演示者問 Astra 提問:你記得在哪兒看到我的眼鏡了嗎?Astra 告訴她:眼鏡在桌子上,紅蘋果旁邊。演示者順著 Astra 的回答,找到了眼鏡。

她放下手機,戴上眼鏡,一個開啟眼鏡的提示音出現。接著下一個轉場,畫面中出現了一個代表 Astra 的小圓點。

演示者繼續與 Astra 對話,詢問白板上的開發流程圖如何優化,Astra 很快給出了答案——一邊語音播報,一邊將播報文字投射在眼前。

很明顯,使用眼鏡與使用手機與 AI 對話的方式有一些不同:
眼鏡上的攝像頭替換了手機上的攝像頭,眼鏡上的麥克風替換了手機上的麥克風,眼鏡上的揚聲器替換成了手機上的揚聲器,眼鏡上的光學顯示系統替代了手機的顯示屏。
眼鏡替換成手機,成為谷歌新 AI 助理 Project Astra 的硬件載體。
這副眼鏡看起來很輕盈,樣子與日常佩戴的光學眼鏡差不多,卻多了眼睛、耳朵、嘴巴的功能:
眼鏡:攝像頭捕捉環境畫面,采集影像信息
耳朵:麥克風聆聽環境聲音,識別語音指令
嘴巴:信息經過(手機)中樞處理后,經(眼鏡)揚聲器播報反饋
在硬件設計上,它與 Meta 的第二代智能眼鏡的設計思路一脈相承。不同之處是,谷歌提前做到了 Meta 沒有做到、并準備在下一代產品中集成進來的 AR 顯示功能。

谷歌剛剛就 Gemini 的三個模型做了更新:
Gemini 1.5 Pro 在翻譯、推理、編碼等關鍵用例上做了優化,能夠勝任更復雜的任務處理。
Gemini 1.5 Flash 是 Google 發布的一款新的輕量級模型,主要用于處理高頻、簡單任務,具備快速響應的能力。
Gemini nano 是一款端側輕量級大模型,將集成在 Android 底層系統,作為一項能力向設備提供。能支持語音理解、圖像識別,以及將消息、郵件和文檔,提煉合成簡潔、可讀的摘要內容。
具體用例方面,Gemini nano 可以讀懂手機界面上的信息、提煉 PDF 等文檔關鍵信息,并支持語音問答。還能根據陌生電話涉及的索要身份信息、銀行賬號等敏感詞匯,識別詐騙電話。
從另一個層面,谷歌新眼鏡又是 Project Astra 的載體。
Project Astra 是一款實時多模態 AI 助理,通過手機攝像頭和麥克風感知物理世界,通過語音和文本與人類交流對話。

演示者用 Pixel 手機攝像頭對準桌面,詢問桌面上什么東西能發出聲音時,Astra 準確的回答:是揚聲器。
演示者繼續問,這個顯示器上面這部分是什么?Astra 準確地回答:是高音單元。

Astra 還可以記得東西放在哪里,可以給金毛狗和寵物熊的樂隊組合起名,可以查看電腦屏幕上的代碼,可以環顧窗外告訴你這是哪里。




灣里小結:
Project Astra 將接替 Google Assistant 成為新的融合多模態 AI 能力的新 AI 助手,它代表著谷歌人工智能的未來。
作為大模型交互界面的 AI 手機和 AI 眼鏡,將成為最重要的、可以隨身攜帶的 AI 硬件載體。
只有麥克風和揚聲器的音頻 AI 眼鏡(李未可、米家等),有麥克風也有攝像頭的音視頻 AI 眼鏡(Ray-Ban Meta),加上 AR 顯示并擁有大模型接入能力的 AI 眼鏡,智能眼鏡的新進化之路已經清晰。
主筆:周森 / 深圳灣
編輯:陳述 / 深圳灣