ByteDance 的次世代 AI 模型可以根據文本、圖片、音頻和視頻生成片段

字節跳動表示其全新 AI 視頻模型能更準確地跟隨提示。

隨著字節跳動推出下一代視頻生成器,大型科技公司在最新 AI 模型的競爭中繼續發力。字節跳動這家總部位於中國的公司在一篇博客文章中表示,Seedance 2.0 支援結合文本、圖片、視頻和音頻的提示。該公司聲稱它「在生成質量上實現了顯著的躍升」,並在生成多個主題的複雜場景及遵循指令的能力上有所改善。用戶可以通過向 Seedance 2.0 提供最多 9 張圖片、3 段視頻和 3 段音頻來細化他們的文本提示。該模型可以生成長達 15 秒的帶音頻片段,並進行攝影……

詳情請參閱 The Verge 的報導。