品玩1月10日訊,阿里旗下通義萬相宣布推出 2.1 版本模型升級(jí),視頻生成、圖像生成兩大能力均有顯著提升。
在視頻生成方面,通義萬相 2.1 通過自研的高效 VAE 和 DiT 架構(gòu)增強(qiáng)了時(shí)空上下文建模能力,支持無限長 1080P 視頻的高效編解碼,首次實(shí)現(xiàn)了中文文字視頻生成功能,登上 VBench 榜單第一。通義萬相 2.1 支持中英文視頻,都可以一鍵生成藝術(shù)字,還提供多種視頻特效選項(xiàng),以增強(qiáng)視覺表現(xiàn)力,例如過渡、粒子效果、模擬等等。
圖片生成方面,通義萬相 2.1 支持文生組圖,采用了 IC-LoRA 圖像生成訓(xùn)練方法,利用 DiT 架構(gòu),增強(qiáng)文本到圖像的上下文能力;對(duì)多張圖像進(jìn)行拼接與聯(lián)合描述即可實(shí)現(xiàn)關(guān)聯(lián)圖像間的組合生成,并保持特征穩(wěn)定連續(xù)。
? 版權(quán)聲明
本頁內(nèi)容中文字和圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系admin#aiodt.com刪除。
相關(guān)文章
暫無評(píng)論...