为了账号安全,请及时绑定邮箱和手机立即绑定

Sora2最强对手——谷歌Veo3.1带来哪些技术提升?附0.4/条Veo3.1 APi调用教程

标签:
人工智能 API

Sora 2一出它的对头谷歌坐不住了,立马推出新一代AI视频生成模型Veo 3.1“Sora的最强对手”,较比上一个版本提升了AI视频的叙事控制能力、音频融合度与画面真实感。

Veo3是啥?如果你忘了可以在脑海里想想前几个月的ASMR沉浸式切割玻璃水果视频,就是由Veo3模型生成,清脆爆汁的音效和质感也引起了一波热度。

那么这次的Veo3.1带来哪些新的技术提升?Veo3.1和Sora2对比哪个更强?怎么调用便宜稳定的Veo3.1和Sora2视频模型APi?


v2-c5c80a3a4b5957797f96f1d0e7ebf4ed_720w


Veo3.1带来哪些新的技术提升?

对比Veo3,Veo3.1将生成式音频、精细化的编辑控制与高质量的视觉输出进行了深度整合,为创作者提供了更强的叙事能力。

1.视听同步突破

Veo 3.1首次实现原生音频同步生成,能自动创建与画面完美匹配的背景音乐、环境音效和人物对话。


v2-57c5b3d63c01bd898e99bb66773bdab8_720w

2.2个精准编辑能力

任意添加新元素:使用“插入 (Insert)”功能可以向场景中添加任何想象中的事物,可以处理复杂的细节,如阴影和场景光照,使添加的元素看起来更自然。

无缝移除多余物体 :"移除"功能目前还没有上线,据官方介绍“移除”功能可智能擦除指定对象并重建背景,使AI视频工具具备了类似专业后期软件的编辑能力。


v2-98256933be4b72bad94c728c8152fa50_720w


3.3个画面控制升级

打造场景外观:通过“视频配料 (Ingredients to Video)”功能,用户可以上传多张参考图像来精确定义角色、物体和整体视觉风格,模型会利用这些“配料”生成一个与用户设想完全一致的最终场景。


v2-3e42e35e13a80d3305ba5703f8ad8750_720w



控制镜头:通过“起止帧生视频”功能,用户可以提供第一帧和最后一帧,能够生成一个无缝衔接两者的视频,非常适合创作艺术性和转场效果。


v2-d98b6af940a6e57b8a2f349ee0b38fae_720w



创建更长的无缝镜头:通过“扩展 (Extend)”功能,用户可以创作时长达到一分钟甚至更长的视频。每个新生成的视频片段都基于前一个片段的最后一秒内容,从而延续原始片段的动作,对于创建长镜头或建构镜头非常有用。

4.性能全面优化

在模型底层,Veo 3.1在提示词遵循度、画面真实感和物理模拟准确性上均有显著提升。支持720p与1080p分辨率输出,结合延伸功能可使视频长度突破一分钟。


v2-2ea32a3d1042b227699bc299c4120003_720w


Veo3.1 VS Sora2

这两个近期最热门的视频模型谁的效果好?

定位与体验

谷歌 Veo 3.1:更像一个专业的视频编辑工具,提供了强大的编辑功能“素材转视频”、“起止帧转视频”和“视频延伸”这些功能现在都集成了原生音频生成。还引入了对象级的“插入”和“移除”编辑功能,能够对视频进行精细调整。非常适合对画面一致性、品牌规范有高要求的创作。

OpenAI Sora 2:更偏向快速生成与社交分享,特别是APP采用了短视频的滑动操作体验,设置了“客串”和“二次创作”等强社交功能,极大地降低了用户参与热门创作的门槛。对于需要快速产出社交媒体内容、激发灵感的用户来说,Sora 2提供了非常流畅的体验。

目前sora2 需要邀请码,并且支持免费生成。Veo3.1仅对Gemini API付费用户开放。计费标准延续前代:标准版:每秒视频0.40美元,Fast版:每秒视频0.15美元

风格与能力

Veo 3.1:画面风格更加精致,偏向电影质感,视觉效果雕琢得更好,但会出现丢帧和图像与声音不匹配的情况。它支持720p和1080p分辨率的输出。同时支持上传人像创作而sora2目前并不支持,

Sora 2:画面则被认为更自然,类似于手持拍摄的“抓拍感”,给人一种真实、不经意的感觉,图声节奏可以同时匹配,并且对风格以及效果的掌控力更强,输出的质量更好些。在生成长度上,免费用户可以在APP和网页端生成最长15秒的视频,而Pro用户在网页端更是可以解锁25秒的时长,高分辨率满足商业需求。

特色功能

Veo 3.1的精细编辑:Veo 3.1在编辑控制上非常突出。它支持通过多张参考图像来精准定义输出内容的视觉风格。“首尾帧图”可以实现不同场景间的自然过渡,而“场景延伸”功能则可以智能地延续原有视频的动作与逻辑,突破单次生成的时长限制,在Flow中还能对内容进行插入、删除和重新构想

Sora 2的故事板:Sora 2为Pro用户提供了一个名为 “故事板” 的强大功能。这个功能允许创作者以秒为单位精确控制每个镜头,包括自定义镜头切换时间、画面运动轨迹和视觉效果,和导演一样规划叙事节奏。


v2-a5b34a86fa7baf7f9d1577a8dc48ed36_720w


Veo3.1+Sora2 API调用方法

普通用户如何使用?

Veo3.1普通用户可以通过Flow平台https://labs.google/fx/zh/tools/flow体验,免费用户每月可获得100积分用于生成视频。

Sora2 目前只有邀请用户才能免费体验,需要获取邀请码,Pro用户可以直接使用生成25s的高分辨率视频。

企业开发者API调用方法

Veo 3.1主要通过Gemini APIVertex AI向开发者和企业用户提供。它采用按需计费模式,Pro为每秒0.40美元,Fast版为每秒0.15美元,仅对成功生成的视频收费。而GrsAi的Veo3和Veo3.1 Fast版一条视频0.4,pro则2元一条,Sora2 0.4/条。价格比官网便宜,且稳定性高。


如何使用

1.打开GrsAi官网https://grsai.com/ 进入控制台


v2-482e2b4f77a54aa83ff6d3a1e1a5f24a_720w




2.创建一个Api key


v2-6bfb4076694a2a2dab548703657463bc_720w




3.在线体验/文档 查看不同模型调用方法,并且可快捷体验效果


v2-67739ecc14d775522453d601b7aac7f6_720w




GrsAi有一个存储库,Grsai可直接把图片与视频文件上传到存储库中,从而降低开发者与企业的服务器流量成本。


v2-a44a9cd9ba7a2afe1e317ea8453956f8_720w



支持哪些模型?

sora-image(Gpt4o)——¥0.02/张

nano-banana——¥0.022/张

sora-2——¥0.08/条

flux-kontext-pro——¥0.035/张

Veo3.1/Veo3.0-fast——¥2.0/条

Veo3.1/Veo3.0-pro——¥2.0/条

Gemini-2.5-Flash——Input ¥0.3/M, Output ¥0.6/M

Gemini-2.5-Pro(满血版不截断)——Input ¥1.25/M, Output ¥6.25/M

.........更多到GrsAihttps://grsai.com/模型列表查看


v2-7d424c7bf00580843b64412b2e30e3b1_720w




点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

举报

0/150
提交
取消