每日一詞|文生視頻大模型 text-to-video large AI model
中國日?qǐng)?bào)網(wǎng) 2024-05-07 14:33
4月27日,2024中關(guān)村論壇年會(huì)上首次發(fā)布我國自研的具“長時(shí)長、高一致性、高動(dòng)態(tài)性”特點(diǎn)的文生視頻大模型Vidu。這一視頻大模型由清華大學(xué)聯(lián)合北京生數(shù)科技有限公司共同研發(fā),可根據(jù)文本描述直接生成長達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容。
Vidu, a text-to-video large AI model capable of creating a 16-second, high-definition video in 1080p resolution with a single click, was unveiled on April 27 at the 2024 Zhongguancun Forum. Developed by Tsinghua University and Chinese AI firm ShengShu Technology, Vidu is China's first video large AI model with "extended duration, exceptional consistency and dynamic capabilities".
【知識(shí)點(diǎn)】
Vidu是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型。與Sora一致,Vidu能夠根據(jù)提供的文本描述直接生成長達(dá)16秒的高質(zhì)量視頻。除了在時(shí)長方面的突破外,Vidu在視頻效果方面實(shí)現(xiàn)顯著提升,主要體現(xiàn)在模擬真實(shí)物理世界、多鏡頭語言、時(shí)空一致性高、理解中國元素等方面。
在動(dòng)態(tài)性方面,Vidu能生成復(fù)雜的動(dòng)態(tài)鏡頭,不再局限于簡(jiǎn)單的推、拉、移等固定鏡頭,而是能在一段畫面里實(shí)現(xiàn)遠(yuǎn)景、近景、中景、特寫等不同鏡頭的切換,包括能直接生成長鏡頭、追焦、轉(zhuǎn)場(chǎng)等效果。
【函電賀詞】
當(dāng)前,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能、區(qū)塊鏈等新技術(shù)深刻演變,產(chǎn)業(yè)數(shù)字化、智能化、綠色化轉(zhuǎn)型不斷加速,智能產(chǎn)業(yè)、數(shù)字經(jīng)濟(jì)蓬勃發(fā)展,極大改變?nèi)蛞刭Y源配置方式、產(chǎn)業(yè)發(fā)展模式和人民生活方式。
New technologies such as the internet, big data, cloud computing, artificial intelligence and blockchain are undergoing profound changes; the digitalized, intelligent and green transformation of industries are accelerating; and the intelligent industry and digital economy are thriving. These have greatly changed the global allocation of factors and resources, industrial development models, and people's lifestyles.
——2023年9月4日,習(xí)近平致2023中國國際智能產(chǎn)業(yè)博覽會(huì)的賀信
【相關(guān)詞匯】
智能產(chǎn)業(yè)
intelligent industry
算力
computing power
中國日?qǐng)?bào)網(wǎng)英語點(diǎn)津工作室(本文于“學(xué)習(xí)強(qiáng)國”學(xué)習(xí)平臺(tái)首發(fā))