91视频亚洲_国产在线看一区_九一视频污_91热精品视频_在线观看麻豆_亚洲精品视频在线免费

“卖铲人”也坐不住了!英伟达发布视频AI大模型论文 有望深度赋能自动驾驶|全球快看

来源:科创板日报 发布:2023-04-22 14:18:45

近日,英伟达与慕尼黑大学等院校的研究人员联合发布了一篇有关视频潜在扩散模型(VideoLDM,Latent Diffusion Model)的论文,该模型能够将文本转换成视频,实现高分辨率的长视频合成。相关论文已经发表在预印本网站arXiv上。

研究人员给出“一个泰迪熊正在弹电吉他、高清、4K”等文本提示词后,运用VideoLDM,成功生成了相关视频(已转为GIF格式):

目前,VideoLDM生成视频的最高分辨率可达2048×1280、24帧。研究团队仅公布了论文和一些成品视频案例,暂未开放试用。


(资料图片仅供参考)

据介绍,相对来说,该模型对于训练和计算的要求较低。在文字大模型、文生图大模型发展迅速的当下,受限于视频训练数据的计算成本高昂以及缺乏大规模公开可用的数据集等原因,视频大模型的发展相对较慢。VideoLDM则成功解决了这个关键问题。

从原理上来分析,VideoLDM基于图像数据集预训练,并在此基础上加入时间维度以形成视频框架,最后在编码的视频序列上进行微调,得到视频生成器。

为进一步提高分辨率,研究人员从时间维度将其与扩散模型upsamplers对齐,并与真实视频对比验证,从而将其转换为时间一致的视频超分辨率模型。

此外,研究人员还微调了Stable Diffusion,将其转换为视频生成器。他们通过对Stable Diffusion的空间层进行简单微调,然后插入时间对齐层,从而实现了视频的生成。

落实到应用层面,研究人员给出了两大具有潜力的应用领域:一是驾驶数据的高分辨率视频合成,能够模拟特定驾驶场景,在自动驾驶领域中具有巨大的应用潜力;二是创意内容的生成。

在论文中,团队给出了几个驾驶场景视频的生成案例:

目前,在自动驾驶领域,AI大模型被认为能够赋能感知标注、决策推理等环节。

华泰证券分析师黄乐平、陈旭东等于4月13日发布研报指出,AI大模型有望解决行业数据标注准确率及成本困境。该机构以DriveGPT为例进行分析,大模型能够将交通场景图像的标注费用从行业平均约5元/张降至约0.5元/张。

与此同时,机构还认为大模型将赋能场景生成、轨迹预测、推理决策等环节,能够根据驾驶场景序列数据,生成未来可能发生的多种驾驶环境并预测每种情况下车辆行驶轨迹。国泰君安亦指出AIGC将有助于自动驾驶的推进落地。

关键词:
相关新闻
主站蜘蛛池模板: 亚洲图片色图 | 免费观看情趣v视频网站 | 在线观看亚洲一区 | 97丨九色丨国产人妻熟女 | 国产a√无码专区亚洲av | 久久精品免费大片国产大片 | 2020国产精品久久精品 | 狠狠色噜噜狠狠狠777米奇小说 | 挺进朋友人妻雪白的身体韩国电影 | 久久国产精品一区二区 | 国产精品成人va | 激情视频在线观看 | 国产自国产自愉自愉免费24区 | 久久久久久久影院 | 色翁荡息又大又硬又粗视频 | 免费观看毛片的网站 | 成人毛片网 | 婷婷久久综合九色综合绿巨人 | 欧美老肥妇做爰bbww | 国产成人精品免费视频app软件 | 久久免费视频一区 | 米奇影院888奇米色99在线 | 亚洲 欧美 成人日韩 | 国产综合久久一区二区三区 | 免费一级毛片 | 永久在线毛片免费观看 | 亚洲日本欧美日韩中文字幕 | 久草热8精品视频在线观看 久草热久草热线频97精品 | 午夜无码一区二区三区在线观看 | aa在线免费观看 | 国产青青视频 | 久久久久久久免费视频 | 久久国产乱子伦精品免费强 | 亚洲欧美视频一区二区三区 | 日产日韩亚洲欧美综合搜索 | 日本一级毛片a免费播放 | 国产精品久久久久天天影视 | 亚洲成人免费看 | 欧美激情一区二区亚洲专区 | 色一情一乱一伦一区二区三区日本 | 久操视频在线观看 |