界面新聞記者 | 肖芳
界面新聞編輯 | 文姝琪
在百度AI DAY科技開放日上,百度移動生態商業研發團隊正式發布自研視頻生成模型MuseSteamer,及視頻產品平臺“繪想”。MuseSteamer采用DIT架構,參數和業界最大的視頻生成模型在同一個量級,支持生成連續10s動態視頻,最高可生成分辨率為1080P的高清視頻。
百度自研的視頻生成模型還是來了,但并不是來自研發文心大模型的技術中臺部門TPG。
去年10月,百度CEO李彥宏曾在內部講話中稱百度不會做視頻生成模型,因為Sora這種視頻生成模型的投入周期太長。
在媒體溝通會上,百度副總裁、移動生態商業體系負責人陳一凡在一開場就向界面新聞等媒體解釋了為何百度要做視頻生成模型的問題。他表示,為了幫助代理商和廣告主快速地生成廣告,去年百度移動生態商業體系推出了擎舵平臺。但有代理商和廣告主反饋說,一些偏科幻的場景很難拍攝,希望能通過大模型生成。移動生態商業體系調研之后,決定自研視頻生成模型。
一位百度內部人士也向界面新聞解釋稱,去年李彥宏在內部講話中還提到,基于多模態的需求,可以做一些相對特定的視頻生成場景。百度前段時間發布的羅永浩數字人以及此次發布的視頻生成模型都是基于特定場景和特定需求的,這是百度內部一直在探索的。
目前,市場上大多數視頻生成模型都是技術驅動型,即通過不斷優化算法、增加算力、豐富數據等技術手段,提升模型性能和生成視頻的質量,以滿足用戶需求和市場競爭,但模型并沒有確定性的應用場景,而是隨著模型能力的提升進行持續探索。相比之下,百度視頻生成模型最大的不同就是商業驅動,即先有了明確的商業需求,再結合需求研發模型。
百度商業體系商業研發總經理劉林向界面新聞透露,MuseSteamer項目在今年春節之后才開始立項,研發團隊有幾十個人,到上線有效的研發時間只有3個月。
劉林表示,MuseSteamer之所以能夠在較短時間上線,是因為其在技術上并不是完全從零起步。擎舵平臺在多模態生成上本身就有了一定的技術積累,百度商業體系在模型訓練框架推理、卡片調優上也有一些積累,能夠快速的延續過來。
目前,MuseSteamer模型Turbo版已上線“繪想”平臺,開啟限時免費公測,其余版本將于8月陸續開放。陳一凡表示,“繪想”平臺的定位是一個營銷產品,目標是服務好B端的廣告主。
根據百度官方公布的數據,目前,“繪想”平臺已生成超過100個AIGC廣告在百度商業體系內上線投放。
至于MuseSteamer模型是否會服務C端用戶,陳一凡并沒有給出明確答案。但目前,全新改版的百度搜索已接入MuseSteamer模型,后續百度很可能將其接入更多C端產品來面向普通用戶提供服務。
“C端的想象空間是非常大的,前提是我們把模型做好。”陳一凡表示。
還沒有評論,來說兩句吧...