一段由 Runway Gen-4.5 生成的 AI 影片展示了一個雪人正在城市街道上融化。Runway 宣稱其最新的文本轉視頻模型比之前的版本生成更準確的視覺效果。在週一的博客文章中,Runway 表示其 Gen-4.5 模型能夠產生「電影級和高度真實的輸出」,這可能使得區分真實與 AI 生成的內容變得更加困難。Runway 的公告指出,「Gen-4.5 實現了前所未有的物理準確性和視覺精確度」。它補充說,這個新的 AI 模型在遵循提示方面表現更佳,能夠生成詳細場景而不影響視頻質量。Runway 表示,AI 生成的物體「以真實的重量、動量和力量移動」,而液體則「以適當的動態流動」。根據 Runway 的說法,Gen-4.5 模型正在逐步向所有用戶推出,並將提供與其前身相同的速度和效率。
不過,這個模型仍然存在一些限制,因為它可能在物體恆常性和因果推理方面遇到問題,這意味著某些效果可能會在原因之前發生,例如一扇門在某人使用把手之前就打開了。與此同時,OpenAI 也在加大力度,使其 AI 生成的視頻看起來更加生動。OpenAI 在九月份推出 Sora 2 文本轉視頻模型時,強調了對物理的升級,Sora 的負責人 Bill Peebles 表示:「你可以準確地在水面上的立槳板上做後空翻,所有的流體動力學和浮力都被準確地建模。」Runway 表示,其 Gen-4.5 模型在處理不同視覺風格方面也更具優勢,能夠生成更一致的照片真實感、風格化和電影視覺效果。這家初創公司聲稱,使用 Gen-4.5 創建的照片真實視覺效果可以「與現實世界的畫面在細節和準確性上難以區分」。
