科技中心/李宜樺報導

OpenAI無預警釋出全新影片與音訊生成模型「Sora 2」,並同步上架社交化創作工具「Sora App」。這代不只把「一句話變影片」的速度與穩定度大幅拉高,更把物理邏輯、場景連貫與聲畫同步推進到近乎真人拍攝的層級——像體操落地、籃球打板彈回、滑板kickflip這類需要力學細節的鏡頭,Sora 2能更自然地「失敗、彈跳、碰撞」,不再靠變形硬湊成功,被外界稱是AI影像的「GPT時刻」。
物理更像真 敘事更長更穩
Sora 2強項在於「世界模擬」:它能跨多鏡頭維持場景狀態,並精準追蹤物件關係;同時原生產生對白、環境音與音效,口型匹配更準,風格從寫實、電影到動畫皆可控,擺脫一味同質化的「風格坍縮」。對創作者而言,這代表更長、更連貫、更能導戲的AI鏡頭,敘事不再被迫切成片段。
Cameo數位分身 把自己放進任何場景
這次最爆點的功能是「Cameo」:用戶完成一次性的影像與聲音驗證後,可授權把自己的樣貌與聲線「嵌入」任一Sora場景,朋友也能在獲准的前提下把你加入作品;權限可隨時撤回,並保留對個人影像的控制。官方強調「只有經本人明確同意,任何人不得生成你的形象」,以降低濫用風險。
限量邀請上線 先攻北美iOS App Store衝頂
《Bussiness Insider》報導,OpenAI同時推出獨立「Sora App」,主打「創作優先、少刷多做」,可一鍵Remix彼此的作品、把朋友的Cameo拉進同框;目前採邀請制並率先在美加上架iOS。上線數日便登頂App Store免費榜,掀起全球實測潮。

安全與溯源 可見水印+C2PA成標配
考量深度偽造風險,Sora 2所有輸出皆帶有清晰可見的浮水印,且嵌入C2PA內容溯源中介資料;官方也建立內部影像與聲音反查工具,提高辨識Sora來源的準確度。青少年帳號預設限制無限捲動,並提供家長控管與更嚴格的Cameo許可。這些保守設計,意在在「開放與責任」之間找到平衡。
沒那麼神也夠強 畫質取捨仍在路上
OpenAI坦言Sora 2仍「不完美」,在極端場景或長秒數連續鏡頭上仍會出錯;為兼顧成本,一些輸出在解析度與碼率上做了取捨,仍可能出現壓縮痕與邊緣破綻。但就物理真實感、可控性與聲畫同步的進步而言,已遠超同類平均水準。
從工具到社交 流量戰場洗牌
當「每個人都能一句話拍片、把自己放進故事」成為日常,短影音將迎來新物種:內容創作門檻被徹底壓低,品牌行銷、授權談判與平台治理同步改寫。下一步,當Sora 2擴大開放、上線API、引入更高品質的Pro模型,從創作者經濟到新聞產製、教育培訓都可能被重塑——這不只是一個模型,而是「可編輯現實」的入口。