Google 今(15)日凌晨展開 I/O 開發者大會,首日的主題演講大秀AI,直接正面對決OpenAI,推出全新Gemini 1.5 Pro模型,功能更強大,可以支援較長脈絡長度的資料,像是1500頁的文件或是100封郵件都可以提供摘要,還能透過Gemini Live進行對話,預計會率先開放給Gemini Advanced 的訂閱者使用。
🟡可以處理大量文字、影片、郵件
Gemini 1.5 Pro模型能理解更為龐大的文件,像是長達1500頁的文件檔案的重點整理,或是100 封電子郵件的摘要,還可以處理長達1小時的影片。為了讓所有使用者充分享受到較長脈絡長度的好處,可以透過 Google 雲端硬碟或直接從裝置上傳檔案,將會開放 Gemini Advanced 的訂閱者使用。
🟡提升影像理解能力
Gemini 1.5 Pro 版提升了影像理解能力,舉例來說,在餐廳吃到喜歡的菜,只要拍張照,就可以請 Gemini 提供食譜,或是成為數學家教,將不會的數學題目拍照上傳,Gemini會一步步幫助用戶尋找答案。
🟡用更自然的方式跟 Gemini Live 對話
將為訂閱 Gemini Advanced 的使用者推出 Gemini Live,透過語音技術,使用者能夠以直覺自然的方式與 Gemini 互動,在互動過程中,用戶可以用自己習慣的語速交談,也能中途打斷AI的回應來詢問額外的問題,預計今年下半年推出。
🟡制定複雜計畫
透過 Gemini Advanced可以進行旅遊規劃,不只是顯示一串建議活動清單,更可以為你量身訂做適合的行程。像是問 Gemini:「想帶家人去邁阿密過節。兒子喜歡藝術、老公想吃海鮮。可以從 Gmail 裡面找到航班跟旅館資訊,幫我規劃那週末的行程。」Gemini 會考量航班時間、飲食偏好以及當地資訊,同時了解每個地點的位置以及在各活動之間移動所需的時間,並從 Gmail 撈出航班資訊、利用 Google 地圖推薦飯店附近的餐廳和博物館,並使用搜尋功能推薦其他活動等所有綜合資訊。
我是廣告 請繼續往下閱讀
Gemini 1.5 Pro模型能理解更為龐大的文件,像是長達1500頁的文件檔案的重點整理,或是100 封電子郵件的摘要,還可以處理長達1小時的影片。為了讓所有使用者充分享受到較長脈絡長度的好處,可以透過 Google 雲端硬碟或直接從裝置上傳檔案,將會開放 Gemini Advanced 的訂閱者使用。
🟡提升影像理解能力
Gemini 1.5 Pro 版提升了影像理解能力,舉例來說,在餐廳吃到喜歡的菜,只要拍張照,就可以請 Gemini 提供食譜,或是成為數學家教,將不會的數學題目拍照上傳,Gemini會一步步幫助用戶尋找答案。
🟡用更自然的方式跟 Gemini Live 對話
將為訂閱 Gemini Advanced 的使用者推出 Gemini Live,透過語音技術,使用者能夠以直覺自然的方式與 Gemini 互動,在互動過程中,用戶可以用自己習慣的語速交談,也能中途打斷AI的回應來詢問額外的問題,預計今年下半年推出。
🟡制定複雜計畫
透過 Gemini Advanced可以進行旅遊規劃,不只是顯示一串建議活動清單,更可以為你量身訂做適合的行程。像是問 Gemini:「想帶家人去邁阿密過節。兒子喜歡藝術、老公想吃海鮮。可以從 Gmail 裡面找到航班跟旅館資訊,幫我規劃那週末的行程。」Gemini 會考量航班時間、飲食偏好以及當地資訊,同時了解每個地點的位置以及在各活動之間移動所需的時間,並從 Gmail 撈出航班資訊、利用 Google 地圖推薦飯店附近的餐廳和博物館,並使用搜尋功能推薦其他活動等所有綜合資訊。