Vidu是什么?
Vidu是由生數(shù)科技聯(lián)合清華大學(xué)發(fā)布的中國首個長時長、高一致性、高動態(tài)性視頻大模型。該模型采用原創(chuàng)的Diffusion與Transformer融合的架構(gòu)U-ViT,支持一鍵生成長達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容。Vidu不僅能夠模擬真實(shí)物理世界,還擁有豐富想象力,具備多鏡頭生成、時空一致性高等特點(diǎn)。
生數(shù)科技還發(fā)布了AI繪畫和視頻生成平臺PixWeaver,和3D模型生成平臺VoxCraft AI,支持在線使用。
Vidu在B站發(fā)布的視頻演示:
Vidu的主要功能
- 長時高清視頻生成:Vidu能夠根據(jù)用戶的文字描述生成長達(dá)16秒的高清視頻,分辨率達(dá)到1080P,這在以往的視頻生成模型中是較為突出的,因?yàn)榇蠖鄶?shù)模型通常只能生成幾秒鐘的視頻。
- 高一致性多鏡頭切換:Vidu在生成視頻時,能夠在不同鏡頭之間保持高度一致性,這對于制作敘事連貫的視頻內(nèi)容尤為重要。
- 動態(tài)場景捕捉:該模型不僅能夠生成靜態(tài)畫面,還能夠捕捉和渲染動態(tài)場景,包括復(fù)雜的動作和物體運(yùn)動。
- 物理世界模擬:Vidu能夠模擬真實(shí)世界的物理特性,如光影效果、物體的物理行為等,使得生成的視頻內(nèi)容更加逼真。
- 創(chuàng)意想象力:除了模擬現(xiàn)實(shí),Vidu還能夠基于文本描述或指令,創(chuàng)造出具有想象力的場景和故事,拓寬了視頻內(nèi)容創(chuàng)作的邊界。
- 多模態(tài)融合架構(gòu)U-ViT:Vidu采用了Diffusion與Transformer融合的架構(gòu),這種架構(gòu)的創(chuàng)新使得模型在處理視覺任務(wù)時更為高效和強(qiáng)大。
Vidu的產(chǎn)品價格
Vidu推出了免費(fèi)版、標(biāo)準(zhǔn)版、高級版和尊享版服務(wù)套餐。具體價格和權(quán)益如下:

Vidu的適用人群
- 影視:賦能影視制作,降低拍攝成本,提升拍攝自由度
- 動漫:支持豐富動漫風(fēng)格,激發(fā)多元創(chuàng)作內(nèi)容,解鎖動漫創(chuàng)作新可能
- 廣告:取代傳統(tǒng)流程,定制個性化的創(chuàng)意廣告內(nèi)容,凸顯品牌風(fēng)格,傳遞品牌形象
如何使用Vidu生成視頻?
Vidu已經(jīng)正式上線。
- Vidu中文版:https://www.vidu.cn/;
- Vidu國際版:https://www.vidu.studio/。