首页 > 汽车性能 > 汽车性能 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50来源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

汽车性能更多>>

官方确认乐道L60成为滴滴专车:对标比亚迪汉 一季度财报公布,李斌再谈对蔚来四季度盈利有信心 长城汽车携手清华美院,畅聊魏牌全新高山背后的东方美学故事 一汽红旗5月销量达到34130辆 同比增长10.8% 西安欧亚学院「春山里」入住倒计时!快来Pick你的理想住宿生活! vivo X200 Pro 5G手机优惠,原价4899到手4057 vivo X Fold5大折叠新机重量或低于219克 荣耀和它的新CEO:走出原生家庭 归来仍是王者 索尼中标达州融媒新大楼建设项目,首批设备交付赋能融媒生态战略升级! 小米多款新品认证曝光:平板、时尚影像套装、手表,都来了! 小米汽车回应UWB智能钥匙优势 华为全栈赋能 猛士M817粤港澳车展内饰首秀 江铃汽车(000550):持续发力海外开拓市场空间 深入推进新能源与智能化转型 MONA 03卖这么便宜,何小鹏能赚到钱吗? 历史镜鉴:标致605在E级轿车市场的得与失 三十而立:青花汾酒品质生活大赏,以AI与潮流文化对话年轻世代 限时7.99万起售:东风纳米06上市,10万元内露营“好搭子” 30万级SUV对决!汉兰达VS冠道,家用怎么选? 试驾红旗H5 PHEV:豪华实力兼具性能与经济性 长安汽车张德勇:深蓝汽车有望今年达到盈亏平衡 试驾|燃油车的魅力依旧-福特蒙迪欧VS大众帕萨特 李书福:国内几乎所有的造车新势力都是到吉利挖人的 理想L9智能焕新版与2025款问界M9,谁才是50万级最佳之选? 新款长安逸动轿车申报,提供1.5T燃油 /1.5升插混版 闭眼买,5月第三周MPV销量榜别克GL8第4名、菱智第18名 15万左右拥有一台合资的轿跑SUV深度试驾一汽丰田bZ5 亚洲龙双擎VS汉DM-i:25万级混动轿车对决,看完再决定 精打细算买 MPV!30-40 万价位车型深度解析​ 新一代丰田RAV4发布 全系混动,外观硬派 吉利银河M9全球首发!定位大六座旗舰SUV