近期,抖音集團旗下備受矚目的圖片視頻工具即夢(mèng)AI在官方社交媒體上重磅發(fā)布了一條新功能上線(xiàn)預告片,預示著(zhù)即夢(mèng)AI又將帶來(lái)全新的精彩體驗!
視頻顯示,新功能采用了全新的多模態(tài)視頻生成模型OmniHuman,讓用戶(hù)僅需輸入一張圖片和一段音頻,就可以生成一條生動(dòng)的AI視頻,有望大幅提升AI短片的制作效率和質(zhì)量。
OmniHuman技術(shù)主頁(yè)信息顯示,該模型為字節跳動(dòng)自研的閉源模型,可支持肖像、半身以及全身等不同尺寸的圖片輸入,并根據輸入的音頻,在視頻中讓人物生成與之匹配的動(dòng)作,包括演講、唱歌、樂(lè )器演奏以及移動(dòng)。
對于人物視頻生成中常見(jiàn)的手勢崩壞,也相比現有方法取得了顯著(zhù)的改善。
此外,對動(dòng)漫、3D卡通等非真人圖片輸入的支持效果也較為出色,生成的視頻能保持特定風(fēng)格和原有的運動(dòng)模式。
根據技術(shù)主頁(yè)展示的演示效果來(lái)看,OmniHuman的生成效果已經(jīng)具有較高的自然度。為防止該項技術(shù)被不當利用,字節跳動(dòng)技術(shù)團隊在主頁(yè)中特別標注稱(chēng),OmniHuman將不會(huì )對外提供下載。
即夢(mèng)AI相關(guān)負責人透露,該模型目前已具備較好的表現,但在生成影視真實(shí)級別的視頻上仍存在一定的提升空間。
由其支持的多模態(tài)視頻生成功能會(huì )在即夢(mèng)上以小范圍內測的形式進(jìn)行調優(yōu)調整,并逐步開(kāi)放。
該負責人同時(shí)表示,即夢(mèng)還會(huì )對這一功能設置嚴格的安全審核機制,并且對輸出的視頻標注水印以作提醒,從而確保AI發(fā)揮正面、積極的作用,助力視頻創(chuàng )作者更好地實(shí)現想象力的表達。
Copyright 2025 //m.jzhmzyy.com/ 版權所有 豫ICP備2021037741號-1 網(wǎng)站地圖