2024-05-16

幾秒鐘閃過的谷歌新眼鏡，是 AI 與 AR 最好的硬件載體 | Google I/O

谷歌眼鏡用上了 Meta 智能眼鏡的攝像頭，還有 Meta 準備在下一代增加的 AR 顯示功能，多模態 AI 助手的能力也更勝一籌

谷歌曾在 2022 年的 I/O 大會上展示過一款智能眼鏡，其本質是一款 AR 翻譯眼鏡，支持語音雙向翻譯、手語翻譯等功能，語音助手作為主交互界面，通過近眼顯示提供實時翻譯的字幕信息。

而在剛剛開幕的 Google I/O 2024 開發者大會上，又有一款智能眼鏡短暫亮相——短到只有幾秒，模樣被一帶而過，卻令人過目不忘。

谷歌新眼鏡是伴隨著新 AI 助理 Project Astra 的發布而亮相的。

演示者問 Astra 提問：你記得在哪兒看到我的眼鏡了嗎？Astra 告訴她：眼鏡在桌子上，紅蘋果旁邊。演示者順著 Astra 的回答，找到了眼鏡。

她放下手機，戴上眼鏡，一個開啟眼鏡的提示音出現。接著下一個轉場，畫面中出現了一個代表 Astra 的小圓點。

演示者繼續與 Astra 對話，詢問白板上的開發流程圖如何優化，Astra 很快給出了答案——一邊語音播報，一邊將播報文字投射在眼前。

很明顯，使用眼鏡與使用手機與 AI 對話的方式有一些不同：

眼鏡上的攝像頭替換了手機上的攝像頭，眼鏡上的麥克風替換了手機上的麥克風，眼鏡上的揚聲器替換成了手機上的揚聲器，眼鏡上的光學顯示系統替代了手機的顯示屏。

眼鏡替換成手機，成為谷歌新 AI 助理 Project Astra 的硬件載體。

這副眼鏡看起來很輕盈，樣子與日常佩戴的光學眼鏡差不多，卻多了眼睛、耳朵、嘴巴的功能：

在硬件設計上，它與 Meta 的第二代智能眼鏡的設計思路一脈相承。不同之處是，谷歌提前做到了 Meta 沒有做到、并準備在下一代產品中集成進來的 AR 顯示功能。

谷歌剛剛就 Gemini 的三個模型做了更新：

Gemini 1.5 Pro 在翻譯、推理、編碼等關鍵用例上做了優化，能夠勝任更復雜的任務處理。

Gemini 1.5 Flash 是 Google 發布的一款新的輕量級模型，主要用于處理高頻、簡單任務，具備快速響應的能力。

Gemini nano 是一款端側輕量級大模型，將集成在 Android 底層系統，作為一項能力向設備提供。能支持語音理解、圖像識別，以及將消息、郵件和文檔，提煉合成簡潔、可讀的摘要內容。

具體用例方面，Gemini nano 可以讀懂手機界面上的信息、提煉 PDF 等文檔關鍵信息，并支持語音問答。還能根據陌生電話涉及的索要身份信息、銀行賬號等敏感詞匯，識別詐騙電話。

從另一個層面，谷歌新眼鏡又是 Project Astra 的載體。

Project Astra 是一款實時多模態 AI 助理，通過手機攝像頭和麥克風感知物理世界，通過語音和文本與人類交流對話。

演示者用 Pixel 手機攝像頭對準桌面，詢問桌面上什么東西能發出聲音時，Astra 準確的回答：是揚聲器。

演示者繼續問，這個顯示器上面這部分是什么？Astra 準確地回答：是高音單元。

Astra 還可以記得東西放在哪里，可以給金毛狗和寵物熊的樂隊組合起名，可以查看電腦屏幕上的代碼，可以環顧窗外告訴你這是哪里。

灣里小結：

Project Astra 將接替 Google Assistant 成為新的融合多模態 AI 能力的新 AI 助手，它代表著谷歌人工智能的未來。

作為大模型交互界面的 AI 手機和 AI 眼鏡，將成為最重要的、可以隨身攜帶的 AI 硬件載體。

只有麥克風和揚聲器的音頻 AI 眼鏡（李未可、米家等），有麥克風也有攝像頭的音視頻 AI 眼鏡（Ray-Ban Meta），加上 AR 顯示并擁有大模型接入能力的 AI 眼鏡，智能眼鏡的新進化之路已經清晰。

主筆：周森 / 深圳灣

編輯：陳述 / 深圳灣

深圳灣（微信公眾號 ID：shenzhenware）是最早也是最活躍的硬件創新社區和媒體，關注「軟件+硬件」帶來的場景和交互創新，以及與平臺和應用相連的產業鏈升級。

版權聲明：本文系深圳灣原創，轉載或摘錄請先獲得授權。
深圳灣微信公眾號：shenzhenware。深圳灣同時在頭條號、企鵝號、知乎等主流媒體站開設專欄板塊，歡迎關注。轉載、約稿、投稿、團隊報道請在公眾號對話框回復關鍵字并留下聯系方式。

上一篇：Gemini 陣容擴大，生成式 AI 能力更強，搜索重置更新，多模態 AI 助理看點多

下一篇：全系標配滿級防水，OPPO A5 系列新品正式發布

国产亲妺妺乱的性视频播放,9797WWW成人影片,99精品国产在热久久无毒不卡 ,西方37大但人文艺术人山踪林