微软亚洲研究院推出NUWA-XL超长视频生成模型

2023-04-20 11:44:18 来源：站长之家

站长之家（ChinaZ.com）4月20日消息:你相信吗?只要输入16句简单描述，AI就能生成11分钟的动画了。

(资料图片)

近日，微软亚洲研究院推出了NUWA-XL超长视频生成模型，采用创新的Diffusion over Diffusion架构，通过「从粗到细」的生成过程，可以并行生成高质量的超长视频，为多模态大模型提供了新的解题思路。

论文地址:https://arxiv.org/abs/2303.12346

NUWA-XL「从粗到细」的生成方法具有三个优势:

分层结构使模型能够直接在长视频上进行训练，从而消除了训练和推理之间的差距。

模型包含多个局部扩散模型，自然支持并行推理，可以显著提高生成长视频时的推理速度。例如在相同的硬件设置下，当生成1024帧时，NUWA-XL 使平均推理时间从7.55分钟减少到26秒，速度提升了94.26%。

由于视频的长度可以相对于深度 m 呈指数级扩展，因此模型可以很容易地扩展出更长的视频。

目前，长视频生成的多数方法是采用「Autoregressive over X」架构，这种方法存在训练-推理差距的问题，导致不真实的、扭曲的镜头变化。

NUWA-XL的推出填补了长视频生成领域的空白，为人工智能在视频生成方面的应用提供了新的可能性。

微软亚洲研究院首席研究员段楠表示，目前人工智能多模态大模型的研发仍停留在文字生成阶段。即使GPT-4已经在理解方面加入了视觉信息，但仅限于图片，输出依旧是文字或代码。因此，当前和未来的研究方向非常明确，就是将语言和视觉的理解和生成融入到一个基础大模型中，以增强图像、视频和音频的生成。他希望未来可以使用一套结构来融合支持语言和视觉的生成算法，使人工智能模型更加通用。

（举报）

微软亚洲研究院推出NUWA-XL超长视频生成模型

微软亚洲研究院推出NUWA-XL超长视频生成模型

视频语音翻译字幕软件_视频语音翻译

潜在的KUV100接班人似乎在Mahindra Thar促销视频中潜伏着|环球快讯

女性浑身没劲恶心嗜睡_女性浑身乏力嗜睡恶心是怎么回事_全球简讯

沙河市“惠家大嫂”巾帼家政志愿服务站挂牌成立-天天亮点

当前焦点!Evija莲花推出世界上最强大的量产车

发改委：及时开展中央猪肉储备调节工作 促进生猪市场平稳运行|今日播报

A/W 2023深圳时装周盛大启幕 摩登生活节激发城市时尚消费活力

商洛市人防办扎实开展全民国家安全教育日活动

世界最新：谷雨诗会丨以诗之名，为三清山抒怀写意

世界热议:3500余盆杜鹃点缀江南园林 醉白池公园春季文化艺术节暨杜鹃展揭幕

1TB版小米13 Ultra售罄

如何制作鲍鱼首饰 每日消息

当前消息！支付宝：五一火车票开售两日，购买火车票订单量同比增长873%

世界快看：1656.47万元主力资金今日抢筹社会服务板块

天天日报丨异佛尔酮二异氰酸酯 IPDI商品报价动态（2023-04-19）

全球快播：《原神》净光翎在哪供奉？ 净光翎供奉地点

让普惠更有温度——贵州全力提升互联网应用无障碍普及率和覆盖面-当前视点

超9.2亿！高能环境2023累计中标6大项目

天天热文：跟盘丨沪指午后弱势震荡 算力概念冲高回落

全球今亮点！长赣高铁详细建设方案公示 总投资846.23亿元

速递！北京专报丨世界大运会如何推进青年切磋与交流？教育部副部长答海报新闻

北京长峰医院火灾事故已致29人遇难，39名伤病员仍在治疗_速读

袁绍势力远胜于曹操，为何最终失败呢？

就这一事件，联合国正式向美国表达关切 天天看点

要闻：农业板块盘中震荡走高

环球精选！【机会挖掘】发改委：将加快推进充电桩和城市停车设施建设

目前长峰医院火灾已致29人死亡-天天精选

4月19日玻璃调价信息汇总_环球快资讯

中兴通讯4月19日快速上涨|天天热点

当前最新：国家电网公司系统内首座全液冷式充电站建成投运

中小银行存款利率集体“补降” 未来或进一步下行-全球聚焦

这场雨有多大？最大降雨量达157.6毫米！今天湘南局地仍有暴雨 全球今热点

环球最资讯丨南京市启动“最美文物守护人”评选

当日快讯：北京将试点在外卖快递车上加装芯片

陕天然气：公司运营天然气长输管道全部为自有，不存在出租和承租

焦点日报：实用！收好这份五一假期防坑指南

全球热门:既有“近愁”也有“远忧”，欧洲天然气短缺可能“卷土重来”

科目三好难 为什么只练3天？科目三考试技巧流利

卓锦股份：4月18日融资买入30.59万元，融资融券余额4670.19万元

环球快看：新华社：火灾事故敲警钟，防火安全需注意

“五一”期间航空出行需求大增 上市航司业绩有望迎来转折点

贵州茅台4月18日现1705.26万元平价大宗交易 当前简讯

全球资讯：汽车市场洗牌加剧 消费需求推动产业加速重构

嫡女风华

奔驰GLB 180空调按钮图解，GLB 180空调除雾和暖风开启方法

消防征文怎么写300字（消防征文怎么写）_每日速讯

京口学子近视患病率明显下降 今日热门

【天天快播报】女性安全期是什么时间段_女性安全期是什么时候

锦旗背后的感人故事——走近泰兴市公安局鼓楼派出所辅警队长秦红军和他的队友们

鲁甸县气象台发布大风预警信号蓝色预警【Ⅳ级/一般】【2023-04-19】

土媒：美国务院批准向土耳其出售F-16战机升级配件|世界消息

华中数控(300161):武汉华中数控股份有限公司前次募集资金使用情况的鉴证报告

有居住证可以用合肥公积金贷款买房吗？-每日看点

世界今日讯！当前待映射的扇区数 警告什么意思_当前待映射的扇区数c5

儿童益智玩具大全解扣_儿童益智玩具大全

寿险转型成效初现：保险股全面上涨 一季度上市险企共揽保费超万亿

世界热推荐：新华社：火灾事故敲警钟 防火安全需注意

牙黄就选它！美国牙医协会认证，牙膏分早晚，呵护才全面

广交会重现万商云集盛况 欧美客商持续看好中国市场

2023上海车展：插混跑车受追捧 体验兰博基尼Revuelto

合肥、淮北被评为全国婴幼儿照护示范城市

世界即时看！林某侮辱江秋莲获刑 都说了什么？

北京进入今年第二个飞絮高发期 将持续至5月7日 环球快资讯

每日看点！鱼缸造景水草籽怎么种_鱼缸造景水草

环球微头条丨2023广州长隆水上乐园有哪些游乐项目？

天天消息！中信银行烟台分行参加烟台市跨境电商协会工作总结交流会

【法眼】小伙“痛斥加班”，结果大反转……

圣湘生物2022年营收64.5亿元，IVD全生态布局加速推进|热讯

572种！占全国39%！陕西鸟类40余年新增200多种-短讯

环球热文：同比增长58.52% 嘉峪关市旅游市场复苏势头强劲

哈铁科技2022年度拟10派0.8元

环球新消息丨让老人就医更方便，北京市新添89家老年友善医疗机构

淘宝买家换货了怎么还能申请退货_淘宝买家申请换货流程

环球快讯:三部门：鼓励金融机构允许新市民以京津冀三地内异地押品提供增信

赛腾股份：拟投建高端半导体、新能源及消费电子智能装备生产基地项目 世界即时看

环球热点！轻纺城：子公司5147.6万元竞得绍兴柯桥马鞍一工业用地

环球热推荐：加拿大广播公司因被标记为「政府资助媒体」退出推特，要求重新审查上述认定

世界微头条丨2023年五险一金最低缴费标准是多少？2023年五险一金一个月大概交多少钱？

发改委：及时开展中央猪肉储备调节工作促进生猪市场平稳运行|今日播报

A/W 2023深圳时装周盛大启幕摩登生活节激发城市时尚消费活力

世界热议:3500余盆杜鹃点缀江南园林醉白池公园春季文化艺术节暨杜鹃展揭幕

如何制作鲍鱼首饰每日消息

全球快播：《原神》净光翎在哪供奉？净光翎供奉地点

天天热文：跟盘丨沪指午后弱势震荡算力概念冲高回落

全球今亮点！长赣高铁详细建设方案公示总投资846.23亿元

就这一事件，联合国正式向美国表达关切天天看点

这场雨有多大？最大降雨量达157.6毫米！今天湘南局地仍有暴雨全球今热点

科目三好难为什么只练3天？科目三考试技巧流利

“五一”期间航空出行需求大增上市航司业绩有望迎来转折点

贵州茅台4月18日现1705.26万元平价大宗交易当前简讯

全球资讯：汽车市场洗牌加剧消费需求推动产业加速重构

京口学子近视患病率明显下降今日热门

世界今日讯！当前待映射的扇区数警告什么意思_当前待映射的扇区数c5

寿险转型成效初现：保险股全面上涨一季度上市险企共揽保费超万亿

世界热推荐：新华社：火灾事故敲警钟防火安全需注意

广交会重现万商云集盛况欧美客商持续看好中国市场

2023上海车展：插混跑车受追捧体验兰博基尼Revuelto

世界即时看！林某侮辱江秋莲获刑都说了什么？

北京进入今年第二个飞絮高发期将持续至5月7日环球快资讯

赛腾股份：拟投建高端半导体、新能源及消费电子智能装备生产基地项目世界即时看

每日焦点！大摩：予港交所(00388)“减持”评级目标价253港元

天天最资讯丨交通迎亚运浙江定下这些“小目标”

品牌转型再加速，起亚携全新阵容闪耀上海车展环球新动态

电风扇图片电风扇地方|热闻

天天即时看！戏曲的种类有哪些戏曲的种类

天天日报丨崇达技术(002815.SZ)：2022年度净利增14.95%至6.37亿元拟10派2.9元