欧美成人三级视频网站,国产一区国产二区国产三区,青青久久av北条麻妃黑人,亚州综合一区

訊飛智文
當(dāng)前位置:首頁>AI工具>AI視頻工具>W.A.L.T:通過擴散模型生成逼真視頻的AI模型

W.A.L.T:通過擴散模型生成逼真視頻的AI模型

近日,谷歌與李飛飛的斯坦福團隊攜手推出了基于Transformer的視頻生成模型W.A.L.T。該模型利用因果編碼器和窗口注意的變壓器架構(gòu),成功將圖像和視頻壓縮到一個共享的潛在空間,實現(xiàn)了聯(lián)合訓(xùn)練和生成。這一創(chuàng)新性的模型不僅在已建立的視頻和圖像生成基準(zhǔn)測試上取得了SOTA,還展示了在文本到視頻生成任務(wù)中的卓越性能。

W.A.L.T:通過擴散模型生成逼真視頻的AI模型

這種方法有兩個關(guān)鍵的設(shè)計決策。首先,它使用因果編碼器共同壓縮圖像和視頻,使其在統(tǒng)一的潛在空間內(nèi)進(jìn)行訓(xùn)練和生成,支持跨模態(tài)操作。其次,為了內(nèi)存和訓(xùn)練效率,它使用了專為聯(lián)合空間和時空生成建模量身定制的窗口注意力架構(gòu)。這些設(shè)計決策的結(jié)合使得W.A.L.T在已建立的視頻(如UCF-101和Kinetics-600)和圖像(如ImageNet)生成基準(zhǔn)測試中達(dá)到了最先進(jìn)的性能,而且不需要使用無分類器的引導(dǎo)。

W.A.L.T官方演示視頻:

W.A.L.T項目地址:https://walt-video-diffusion.github.io/

?版權(quán)聲明:如無特殊說明,本站所有內(nèi)容均為AIHub.cn原創(chuàng)發(fā)布和所有。任何個人或組織,在未征得本站同意時,禁止復(fù)制、盜用、采集、發(fā)布本站內(nèi)容到任何網(wǎng)站、書籍等各類媒體平臺。否則,我站將依法保留追究相關(guān)法律責(zé)任的權(quán)利。
0 條回復(fù) A文章作者 M管理員
    暫無評論內(nèi)容
error:
主站蜘蛛池模板: 南充市| 西林县| 兰州市| 高清| 巨野县| 若羌县| 新建县| 庆阳市| 汽车| 西乌| 崇阳县| 建始县| 望江县| 伊金霍洛旗| 蓝山县| 长泰县| 白银市| 龙陵县| 故城县| 莒南县| 乌苏市| 赤水市| 双江| 密山市| 阳新县| 玉屏| 利津县| 尼木县| 万全县| 永济市| 奉贤区| 韶关市| 诸城市| 长泰县| 武宁县| 通化市| 杭锦后旗| 怀宁县| 巍山| 荥经县| 华蓥市|