谷歌最强视频生成AI模型Veo3亮相：背景音、人物对话都不在话下

IT之家 5 月 21 日消息，在今年的 I/O 开发者大会上，谷歌发布新一代视频生成模型 Veo3，这也是其首个可生成视频背景音效的模型。它不仅能合成画面，还能为鸟鸣或街头交通等场景配上相应的音效，甚至还可生成人物对话。

谷歌称，Veo 3 在物理模拟与口型同步方面也表现优异。目前，该模型仅面向美国地区的 Gemini Ultra 用户，以及 Vertex AI 的企业用户开放，也已集成进谷歌的 AI 影视制作工具 Flow 中。

用户仍可为 Veo 2 提供人物、风格、场景或物体的图像参考，并通过 Flow 使用镜头控制功能进行旋转、缩放，甚至将画面从竖屏调整为横屏，或在视频中添加、删除元素。

当前用户越来越难以辨别 AI 生成内容，谷歌为此推出了 SynthID Detector。用户可上传媒体文件以检测其是否包含 SynthID 水印，这是谷歌用于识别 AI 作品的标记工具。不过，目前并非所有图像生成模型都支持这一水印。

谷歌 I/O 开发者大会仍在进行，IT之家将保持关注。

扫描下方二维码，关注浅说艺术

关注公众号

即时获知最新推送

休闲时刻

陶冶艺术情操

友情链接： 国家数据局中国科学院国家自然科学基金委员会中国工程院中国科学技术协会　中国社会科学院国家科学技术部国家工业和信息化部　国家发展改革委员会　国家农业部　国家教育部国家卫生健康委员会　中国农业科学院　国家知识产权局国家市场监度管理总局国家能源局国家科技管理信息系统公共服务平台国际欧亚科学院中国科学中心国际机器人联合会

地址：北京市海淀区翠微中里14号楼