開發聊天機器人ChatGPT的科技公司OpenAI,今(16)日宣布推出一款全新AI模型「Sora」,可以根據使用者輸入的文字內容,生成最長一分鐘的影片,視覺效果相當逼真出色。不過,OpenAI表示目前不會開放給公眾使用,還在進行安全測試,評估「Sora」潛在的風險和危害。
OpenAI介紹Sora的功能,稱其可以按照使用者輸入的文字指令,生成高品質的影片,片長最多一分鐘,可以呈現包含多個人物、特定動作的複雜場景,準確突顯出主題的細節,並符合現實世界中的物理特性。
OpenAI在X上分享了多則實例,其中一則輸入的文字內容為,「美麗的、白雪皚皚的繁華東京城,鏡頭穿過熙熙攘攘的城市街道,跟著幾個行人享受美麗的雪天,並在附近的攤位購物。迷人的櫻花花瓣隨著雪花在風中飛舞」,而生成影片呈現的效果相當驚艷,不僅畫面逼真,且鏡頭十分靈活。
不過,OpenAI也指出Sora目前仍存在弱點,包括一些較複雜的空間細節會出現不合邏輯的情況,對於特定因果關係的理解也會出錯,比如說影片中被咬下的餅乾仍然完整,沒有出現被咬過的缺口等等。
另外,Sora也正在進行內部安全測試,評估若被用於製造假訊息、仇恨內容等違反規定的情境,可能會帶來的風險和危害。OpenAI表示,目前除了開放給安全測試團隊紅隊(red-teaming)成員外,僅有開放給少數特定用戶,以釐清Sora在使用上可能的顧慮,在有結論前不會開放給公眾使用。
我是廣告 請繼續往下閱讀
OpenAI在X上分享了多則實例,其中一則輸入的文字內容為,「美麗的、白雪皚皚的繁華東京城,鏡頭穿過熙熙攘攘的城市街道,跟著幾個行人享受美麗的雪天,並在附近的攤位購物。迷人的櫻花花瓣隨著雪花在風中飛舞」,而生成影片呈現的效果相當驚艷,不僅畫面逼真,且鏡頭十分靈活。
OpenAI表示,除了將文字轉換成影片,Sora也可以把圖片動態化生成影片,或是根據現有影片延長補充。OpenAI相信,Sora將是實現通用人工智慧(Artificial General Intelligence,AGI)的重要里程碑,因為它能深度理解使用者的文字以及現實世界,才能進行精準的影片生成演繹。
不過,OpenAI也指出Sora目前仍存在弱點,包括一些較複雜的空間細節會出現不合邏輯的情況,對於特定因果關係的理解也會出錯,比如說影片中被咬下的餅乾仍然完整,沒有出現被咬過的缺口等等。
另外,Sora也正在進行內部安全測試,評估若被用於製造假訊息、仇恨內容等違反規定的情境,可能會帶來的風險和危害。OpenAI表示,目前除了開放給安全測試團隊紅隊(red-teaming)成員外,僅有開放給少數特定用戶,以釐清Sora在使用上可能的顧慮,在有結論前不會開放給公眾使用。