大家好,我是阿坑。这几天AI圈的热闹程度,简直像过年了一样。
先是国内图生视频领域直接包揽全球测评前三,然后是神秘的AI视频模型“Happy Horse”横空出世,阿里发布Wan2.7-Video聚焦创作全链路,OpenAI又把Sora 2送上了风口浪尖。 而一直低调刷屏的谷歌Nano Banana 2,则在这个AI多模态大乱斗的时代,走出了一条完全不同的路。
今天,我想以Nano Banana 2为主线,顺带聊聊国产模型的逆袭,再把我珍藏已久的“省钱神器”分享给大家。没有任何夸张的广告,纯干货,放心食用。
一、谷歌Nano Banana 2:把AI生图拉进了“事实时代”
2月26日,谷歌深夜发布了Nano Banana 2(代号Gemini 3.1 Flash Image)。这款模型刚一出,在Artificial Analysis的文生图基准测试中就拿下全球第一,得分1280,全面超越了GPT Image 1.5和自家的Nano Banana Pro。 -1
很多人可能会问,这玩意儿到底强在哪?我简单说三点。
第一,它学会“查资料”了。 以前的AI画东西,全靠蒙——你让它画天安门,它大概率给你一个长相完全不对的建筑,因为模型根本不知道天安门长啥样。但Nano Banana 2不一样,它在生成图像之前,会主动去谷歌搜索实时信息和图像,搞清楚真实世界的建筑、品牌Logo、地标长什么样,然后才动手渲染。-1简单说,它把AI生图从“创意盲盒”拉进了“事实时代”。 -6
谷歌官方还专门做了一个叫“Window Seat”(靠窗座位)的演示——用户选定世界上任何一个地点,模型就能实时生成那扇窗户往外看的景色,还会自动拉取当地实时天气数据。足不出户,坐拥全球美景。-4
第二,它解决了“角色变脸”的世纪难题。 做过分镜、漫画或品牌设计的朋友一定深有体会——同一个角色,换个场景就完全变了一张脸,改图改到崩溃。Nano Banana 2现在可以在单一工作流中保持最多5个角色的特征高度一致,同时还能维持最多14个对象的高保真呈现。 -7这意味着你做一个漫画系列,从第一页到最后一页,人物长相不会跳戏。
第三,它修好了“中文乱码”。 用过海外AI生图工具的朋友都知道,让它们写中文,出来的基本是一堆谁也看不懂的“鬼画符”。Nano Banana 2在这一块进步非常明显——海报标题、屏幕UI、白板手写体都能清晰呈现,中文支持度直接拉满。-4
二、国产大模型的逆袭:包揽全球前三,这是我们的“DeepSeek时刻”
如果Nano Banana 2代表了国际顶尖水平,那国产模型近期的表现,真可以用“扬眉吐气”来形容。
4月8日,SuperCLUE发布了2026年4月中文图生视频模型测评榜单。结果令人振奋:国产模型直接包揽前三名,实现对海外模型的反超。 -31
爱诗科技的PixVerse V6以76.00分拿下榜首,字节跳动的Doubao·Seedance 2.0和生数科技的Vidu Q3 Pro紧随其后,三者构成强势第一梯队。海外模型中表现最好的Google Veo 3.1仅排第五,已经被国产模型拉开了明显差距。-31
更值得关注的是字节跳动的Seedance 2.0。这款2月发布的模型,登顶了AI视频生成Elo榜(1269分),超越了Google Veo 3、OpenAI Sora 2和Runway Gen-4.5。它首创了双分支扩散Transformer(DB-DiT)架构,实现了原生音画同步、最长60秒2K视频、8+语言唇形对齐,可用率高达90%。-51
与此同时,阿里在4月8日发布了Wan2.7-Video,聚焦创作全链路,支持文本、图像、视频及音频全模态输入,覆盖生成、编辑、复刻、重塑、驱动、续写及参考等完整流程,号称“更可控、更全能、能导擅演”。-53
三、OpenAI Sora 2:刚发布就关停?
4月2日,OpenAI发布了Sora 2,号称是“最先进的视频生成模型”,同时还推出了一款TikTok风格的社交应用,让用户可以把自己插入到AI生成的视频中(这项功能叫“cameos”)。-62
可不到一个月后,3月25日,OpenAI突然宣布关停Sora应用和API服务,同时终止了与迪士尼之间价值10亿美元的合作。-
从2025年9月Sora 2发布时的“视频领域的GPT-3.5时刻”,到如今关停退场,短短25个月,Sora从封神到落幕,走完了完整的技术生命周期。 -OpenAI给出的理由是:研发重心转向“能够与物理世界互动的人工智能与机器人系统”。-这背后,或许也折射出视频生成赛道竞争的残酷——谷歌的Veo 3、字节的Seedance 2.0、阿里的Wan2.7-Video都在加速追赶,Sora的退场,也许只是大洗牌的开始。
四、百花齐放,才是创作者最好的时代
梳理完这几天的动态,我有一个很深的感触:AI多模态赛道正处在一个百花齐放的爆发期。
谷歌的Nano Banana 2走的是“事实驱动”路线,用实时搜索和信息核验解决商用痛点;字节的Seedance 2.0走的是“工业级视频生成”,60秒2K、原生音画同步、8+语言唇形对齐,直接对标电影工业;阿里的Wan2.7-Video走的是“创作全链路”,从生成到编辑到重塑到续写,一条龙包圆;而神秘黑马Happy Horse一上线就超越所有选手霸榜,开发方至今身份成谜。-52
这种“百家争鸣”的竞争格局,最终的受益者只有一个——那就是我们这些使用AI的创作者、设计师和开发者。模型越多、竞争越激烈,质量越好、价格越低、体验越优化,这是颠扑不破的真理。
五、聊聊我的“省钱神器”
聊了这么多技术,最后说一个我在这个百花齐放时代里,真正受益的工具。
自从入坑AI创作后,我的浏览器标签页从没少于过15个——Gemini官方界面、Midjourney Discord、字节即梦、阿里通义万相……光登录注册充值就能消耗半天时间。更别提很多海外模型在国内访问体验一言难尽,打开转圈圈是常态。 -76
后来在一个技术群里,有朋友给我推荐了橘子AI(www.juziaigc.com) ,这是一个一站式AI模型聚合平台。我用了小半年,感觉真有点相见恨晚。
它最核心的价值,我总结就三点:
第一,所有主流模型,一个入口全搞定。 无论是谷歌Gemini系列(包括Nano Banana 2)、OpenAI的GPT系列、还是字节的Seedance、阿里的通义万相,它都集成了。你不用再开着十几个标签页来回切换,一个平台、一次登录,就能调用市面上几乎所有顶尖模型。而且它支持API搭建,对开发者非常友好。
第二,国内直连,稳得像老黄牛。 不用翻墙、不用开加速器,国内网络直接访问,响应速度和稳定性比官方渠道还好。这对我这种每天高频调用的人来说,体验感简直翻倍。
第三,也是最重要的一点——价格打骨折。 举个例子,Nano Banana 2在谷歌官方的API价格大约是每张图0.067美元(约合人民币0.48元),而橘子AI上的价格……我只能说,便宜到离谱。批量生成图片和视频的时候,那种“想怎么生就怎么生”的自由感,谁用谁知道。对于创作量大的朋友,这简直是生产力解放神器。
写在最后
从Nano Banana 2的“事实革命”,到国产模型包揽全球前三,再到Sora 2的戏剧性退场——2026年的AI赛道,精彩程度远超想象。
而对我这样每天跟AI打交道的创作者来说,最大的幸福不是哪个模型“封神”了,而是能用最低的成本、最便捷的入口,把所有好模型都用起来。
这就是橘子的价值所在。它不是某一个模型的“独家代理”,而是一座桥——把世界上最顶尖的AI能力,以最便捷、最便宜的方式,送到你面前。
如果你也像我一样,每天跟AI创作打交道,或者正在寻找一个稳定、便宜、模型齐全的AI工具箱,不妨去橘子AI(www.juziaigc.com) 看看。
这是我在2026年做得最值的一个技术投资,没有之一。
共同学习,写下你的评论
评论加载中...
作者其他优质文章