阿里通義萬相 2.1 模型宣布升級(jí):首次實(shí)現(xiàn)中文文字視頻生成功能

品玩1月10日訊,阿里旗下通義萬相宣布推出 2.1 版本模型升級(jí),視頻生成、圖像生成兩大能力均有顯著提升。

在視頻生成方面,通義萬相 2.1 通過自研的高效 VAE 和 DiT 架構(gòu)增強(qiáng)了時(shí)空上下文建模能力,支持無限長 1080P 視頻的高效編解碼,首次實(shí)現(xiàn)了中文文字視頻生成功能,登上 VBench 榜單第一。通義萬相 2.1 支持中英文視頻,都可以一鍵生成藝術(shù)字,還提供多種視頻特效選項(xiàng),以增強(qiáng)視覺表現(xiàn)力,例如過渡、粒子效果、模擬等等。

圖片生成方面,通義萬相 2.1 支持文生組圖,采用了 IC-LoRA 圖像生成訓(xùn)練方法,利用 DiT 架構(gòu),增強(qiáng)文本到圖像的上下文能力;對(duì)多張圖像進(jìn)行拼接與聯(lián)合描述即可實(shí)現(xiàn)關(guān)聯(lián)圖像間的組合生成,并保持特征穩(wěn)定連續(xù)。
阿里通義萬相 2.1 模型宣布升級(jí):首次實(shí)現(xiàn)中文文字視頻生成功能

? 版權(quán)聲明

相關(guān)文章

暫無評(píng)論

none
暫無評(píng)論...