OpenAI新模型Sora!「文字轉影片」效果超逼真 暫不開放公眾使用

▲OpenAI今(16)日宣布推出一款全新AI模型「Sora」,可以根據使用者輸入的文字內容,生成最長一分鐘的影片,圖為Sora生成的猛瑪象。(圖/翻攝自OpenAI的X影片截圖)
記者倪浩軒/綜合報導-2024-02-16 18:08:19
開發聊天機器人ChatGPT的科技公司OpenAI,今(16)日宣布推出一款全新AI模型「Sora」,可以根據使用者輸入的文字內容,生成最長一分鐘的影片,視覺效果相當逼真出色。不過,OpenAI表示目前不會開放給公眾使用,還在進行安全測試,評估「Sora」潛在的風險和危害。

我是廣告 請繼續往下閱讀

OpenAI介紹Sora的功能,稱其可以按照使用者輸入的文字指令,生成高品質的影片,片長最多一分鐘,可以呈現包含多個人物、特定動作的複雜場景,準確突顯出主題的細節,並符合現實世界中的物理特性。

OpenAI在X上分享了多則實例,其中一則輸入的文字內容為,「美麗的、白雪皚皚的繁華東京城,鏡頭穿過熙熙攘攘的城市街道,跟著幾個行人享受美麗的雪天,並在附近的攤位購物。迷人的櫻花花瓣隨著雪花在風中飛舞」,而生成影片呈現的效果相當驚艷,不僅畫面逼真,且鏡頭十分靈活。

OpenAI表示,除了將文字轉換成影片,Sora也可以把圖片動態化生成影片,或是根據現有影片延長補充。OpenAI相信,Sora將是實現通用人工智慧(Artificial General Intelligence,AGI)的重要里程碑,因為它能深度理解使用者的文字以及現實世界,才能進行精準的影片生成演繹。

我是廣告 請繼續往下閱讀

不過,OpenAI也指出Sora目前仍存在弱點,包括一些較複雜的空間細節會出現不合邏輯的情況,對於特定因果關係的理解也會出錯,比如說影片中被咬下的餅乾仍然完整,沒有出現被咬過的缺口等等。

另外,Sora也正在進行內部安全測試,評估若被用於製造假訊息、仇恨內容等違反規定的情境,可能會帶來的風險和危害。OpenAI表示,目前除了開放給安全測試團隊紅隊(red-teaming)成員外,僅有開放給少數特定用戶,以釐清Sora在使用上可能的顧慮,在有結論前不會開放給公眾使用。

我是廣告 請繼續往下閱讀

我是廣告 請繼續往下閱讀