去年,人工智能还只是个新奇玩意儿——现在它却如同一场五级飓风,正在颠覆商业、政治乃至现实本身。
最初的冲击来自ChatGPT和NVIDIA的万亿市值增长,但这仅仅是风暴的前奏。
头条新闻沉寂下来,就像旗帜在我们进入风暴眼时突然变得松弛无力——一种诡异的平静,因为基础模型扩展的高昂成本阻碍了重大突破。然而,在表面之下,激烈的竞争仍然在进行,实验室陷入一场残酷的游戏中,就像在曼谷市中心再开一家泰国餐厅,被迫滴水穿石般地发布部分更新——一次痛苦地分发他们的配方和商业计划,每个部分都像是在受煎熬,每个都拼命地在人工智能无情的排行榜上争抢一席。
开始一个新的基础模型,有点像这样在泰国开一家新的餐厅。
这种欺骗性的平静掩盖了日益加剧的计算浪潮,企业疯狂地竞相将人工智能嵌入到所有事物中。节奏混乱且极其迅速,规模遍及全球,没有任何一家公司、政府或职位能够幸免于这场风暴的影响。
现在来到了最致命的难关——应用程序革命。
接下来的18个月不会是温和演进。这将是那些基于过时假设认为机器能做什么和不能做什么的商业模式的灭绝级事件。我们正目睹技术、经济和地缘政治的基础性重塑。
我们正处于人工智能飓风的中心眼。
五级飓风登陆仅仅一年前,GPT-4 还是人工智能领域的巅峰之作。而现在,一个新的模型类别如同风暴般席卷而来。Anthropic 的 Claude 3.7 号称首款“混合推理”AI,能够从即时回答切换到深度逻辑推理过程。它甚至可以通过一个名为 Claude Code 的代理工具链直接生成生产级代码,从命令行开始自动化一部分软件开发流程。软件工程的“Midjourney”时刻即将来临。
与此同时,埃隆·马斯克的xAI已经将Grok升级到版本3,一个带有讽刺倾向和多模态能力的模型,谷歌的DeepMind/Brain团队随后推出了Gemini 2.0,以在多语言、图像和音频任务上超越所有竞争对手的目标。
然后中国也走进了房间。
OpenAI的商业模式正面临动荡不久前,OpenAI看起来所向无敌——人类集体智慧这条高速公路上的收费员,处于理想位置,可以对经过的每一个思想收取费用,正准备成为所有智能的接口。
花几美分就能从盒子里得到魔法,这个故事曾经很精彩。今天,这个故事已经走到了尽头。大型语言模型(LLMs)的普及化已经打破了OpenAI曾经坚固的壁垒。正如我早些时候预测的那样,通过API提供通用AI模型从来都不是一个持久的竞争优势。核心技术很容易被复制,实际上几乎没有转换成本。确实,每当有更好的模型出现时,人们就会成群结队地转向新的模型——除了可能的聊天记录外,没有什么能锁住你。
训练成本和计算资源。来源:Jabberwocking,奇异先生)
某些AI模型。(来源:Jabberwocking,奇异先生)
我们对Anthropic的Claude有了亲身的感受,这非常明显。有一天,我还在使用GPT-4做所有事情;Claude 2突然出现了,它突然在写我需要的内容上变得更好。我一夜之间就转投了Claude 2。没有人会在意OpenAI花费了1亿美元的计算资源来训练他们的模型——如果竞争对手的输出更好或更便宜,我们就会离开。这个基本的事实一次又一次地发生:从GPT-3到GPT-3.5,然后是Claude,再到GPT-4,再到一堆新的模型(如Claude 3.5、3.7、GPT-4.5等)。每当出现一个能在某些方面做得更好的新竞争者时,用户就会毫不犹豫地转向它。单一主导的AI API的时代几乎和它兴起一样快地结束了。
很快,用户就会对每月支付20美元的订阅来购买那些在更智能的版本出现时立刻变得过时的模型感到厌烦。毕竟,谁愿意继续为昨日的过时助手付费,而今天更敏锐、更快、更强大的版本已经出现呢?这不仅仅是订阅疲劳,更是冗余疲劳。
看着OpenAI四处摸索试图找到一个商业模式,这种似曾相识的感觉真让人无奈,就像是在看OpenAI四处摸索——先是每月20美元的ChatGPT Plus,接着是每月200美元的“企业级”服务诱惑,最近又提出了令人咋舌的每月2000美元甚至20000美元的“代理架构”方案。还记得他们曾尝试过一个名为“GPT”的市场平台,承诺用这些小小的AI机器人来处理一切,结果却一无所成,悄然消失在浩瀚的数字世界中吗?现在,据说他们又要重操旧业,正在筹备另一个市场平台的重启计划。
这个时候,他们可能干脆叫它 Slopify。
来源:The Information
OpenAI的领导层也为此付出了惨痛的代价。他们试图通过建立一个生态系统锁定,以巩固他们的垄断地位。但这并没有达到预期的效果。为什么还要使用受限的API,受限于使用上限、内容过滤器以及延迟问题,而不下载开源模型自行运行呢?
到了2024年末,一些公司开始悄悄地调整方向:不再仅仅依赖OpenAI的API,而是开始内部试验较小的、专门化的模型,或者越来越多地转向这些充满活力且快速发展的开源社区。
OpenAI大幅降低了其API价格,但即使免费也未必足够便宜,如果竞争对手稍有优势。商品化陷阱已经关闭,无法挽回,OpenAI已经陷入了这个陷阱。
正如我去年在MacroVoices播客中提到的,按每次API调用收取几分钱从来都不是一个可持续的商业模式——“最终的事实是,这些基础模型并没有可行的商业模式”。这一现实现在已无法被忽视。
开源主导与护城河的崩溃如果2023年是专有模型震撼世界的一年,那么2024年就是开源项目崭露头角的一年。开源大语言模型和工具的爆炸性增长彻底摧毁了大型科技公司和资金充足的初创公司认为自己拥有的“护城河”。去年一份泄露的谷歌内部备忘录说得最好(点击此处查看备忘录原文):“我们没有护城河,OpenAI也没有”,因为“第三股力量”——开源社区——“更快、更灵活、更注重隐私,且在同等条件下更有能力”于科技巨头。那份具有先见之明的备忘录已经得到证实。
Facebook(Meta)试图通过发布其 LLaMA 模型来引领潮流,公开了部分核心技术,以动摇 OpenAI 的地位——尽管它被称为“开源”,但实际上并不完全符合开源标准。这是一场公司式的“自杀式攻击”,即使有限制,也确实奏效了。几周之内,LLaMA 的权重便不可避免地泄露了,业余爱好者很快调整出了与 GPT-3 相媲美的版本。当 Meta 在其备受争议、并非完全开源的许可证下发布 LLaMA 2(这让开源纯粹主义者感到愤怒)时,社区已经比许多资金充裕的实验室迭代得更快了。突然间,一支全球性的研究人员和黑客大军——不受保密协议、利润目标或严格限制的束缚——在短短几个月内就复制了多年秘密研发的成果。社区驱动的模型改进速度最终快得超过了任何闭源机构的处理能力。OpenAI 和 Google 最担心的事情发生了:人工智能创新的最前沿不再仅仅属于它们;现在,这一切正在不受限制的开源世界中发生,许可证已不再重要。
来源:Llama 和 ChatGPT 并不是开源的 IEEE
看看2024年末发生了什么:一家名为DeepSeek的中国初创公司突然出现,引发整个行业的震动。DeepSeek团队利用有限的资源训练了一个推理模型(“R1”),其表现超过了许多成本高出100倍的西方的模型,这些模型往往需要更多的资源。他们是怎么做到的呢?通过充分利用所有开源资源,并且在效率上不断创新,显然他们并不拘泥于硅谷的某些传统做法。
他们的R1型号在比较弱的硬件上运行,却取得了竞争性的结果——这是明证,证明AI的皇冠珠宝现在是知识、技术与执行力,而不是无限的GPU农场的使用权。当DeepSeek的低价模型能够匹敌巨头的消息传出后,这令投资者惊恐,蒸发了超过一万亿的市值。也就是说,160名不知名的工程师在杭州的一个侧项目中 通过优化他们的模型 达到了与OpenAI的GPT-4相当的水平——市场因此而恐慌,因为西方的AI投资达到了数万亿的资金。
来自 @hxiao
这些影响深远。首先,这证明了开放方法的正确性:DeepSeek 并没有从秘密的专有数据集或其他人无法获取的神奇算法中获益。他们是在开源基础上,并推动了新的优化策略(我们再聊他们的硬件技巧)。请记住,如 OpenAI 的联合创始人兼前首席科学家 Ilya Sutskever 所说,90% 的 AI 技术可以通过 40 篇公开的论文来理解。
其次,它消除了任何剩余的论点,即现任者的“规模优势”会使他们保持安全。事实上,情况恰恰相反——规模庞大已成为一种负担。在OpenAI、微软和谷歌拖着庞大的成本结构和官僚体系时,较小的玩家却以超高速前进。正如一位谷歌工程师所感叹的那样(来自《The Verge》2023年7月10日的文章),开源模型的迭代速度已经超过了大型实验室,而且更加私密。创新的洪流现在正从边缘涌起。
即使与Deep Research结合使用,OpenAI 最新的GPT-4真的非常出色,就像有一个随时待命的中等水平的研究助手。在我的使用体验中,当不开启“深度研究”功能时,它在写代码方面的能力较弱。它的优势窗口正在迅速消失。
原文作者:Gary Marcus
DeepSeek即将推出的模型R2据说在ARC-AGI基准测试中得分接近90%[1],该基准测试专门用于衡量AI是否达到了人类智能水平。如果这属实,OpenAI的逐步改进不仅会显得微不足道,甚至可能显得无关紧要。GPT-4.5的价格昂贵[2],每百万输入令牌收费75美元,每百万输出令牌则为150美元,还不包括暂时无法通过API获得的“深度研究”功能。R2的代码预计是免费的,而且可以在自己的硬件上运行,尤其是中国生产的硬件,成本会更低。
出处:Twitter (还是改不了自己不说 X)
我们已经到了这样的程度,任何新的模型架构或训练方法都会在几个月,甚至几周内被社区以开源形式复制。
来源:(来自)ARC-AGI(一个AI研究组织)
这很难过分强调这一点:护城河不仅仅是流失,它正在 蒸发。构建一个有能力的AI模型的方法已经公开。是的,这仍然需要技能(和一些资金),但不再是人们在2022年所认为的需要数十亿美元才能达到的多年努力。我们已经看到大学团队、独立研究人员和小型创业公司已经能够制造出之前被认为是顶尖水平的模型。
在这场人工智能风暴的中心,是曾经不可争议的先驱者OpenAI——如今却在挣扎求存。其ChatGPT仍然令人惊叹,但公司却在巨额亏损。据报导,OpenAI在2024年就烧掉了约70亿到80亿美元(约70亿至80亿美元)[1],并且预计到2027年,其亏损将达到200亿美元[2],追求更大规模的模型。AI投资人李开复直言不讳地指出[1]:“问题不在于哪个模型好1%,问题是OpenAI的商业模式是否能够持续?”
残酷的真相是,基础模型已经变得像商品一样普及。换句话说,当像DeepSeek这样的中国开源项目能够以GPT-4约2%到10%的成本复制出其约90%的表现时,它就削弱了OpenAI高价API访问的商业模式。很难对一款产品收取高价,而该产品的竞争对手却几乎免费。
当然,说到训练AI模型,中国也有不可动摇的竞争优势。
他们根本就不把版权放在心上。
当美国公司谨慎处理许可协议,雇用一整支律师团队在纠结GPT是否会在引用《哈利·波特》的两行内容时面临法律诉讼时,中国则愉快地从整个互联网上抓取数据(包括你的推文、邮件,甚至可能是你奶奶的私家食谱),并直接将其输入他们的神经网络。相比之下,数据湖就不值一提了,中国直接在运行一个数据海洋。这就像在拳击比赛中,你的一只手被绑在背后,而你的对手则手持链锯。祝你好运,因为这将是一场硬仗。
最近我和一位 Anthropic 的工程师聊到了这个话题。他们轻描淡写地说:“你现在在日本和韩国设立办事处是为什么呢?”
我一直不喜欢先行动者的优势,因为必须付出巨大的努力去改变消费者行为,就像要煮沸海洋一样。相反,后来者可以轻松地跟随在前面的人后面,享受舒适的位置。
我不会对下个月的新闻标题出现这样的内容感到惊讶:在班加罗尔的一间地下室里,五十位默默无闻的工程师发布一个开源模型项目,让ChatGPT看起来就像计算器那么简单——这是对山姆·阿尔特曼轻蔑地将印度的人工智能野心称为“完全无望”的说法的一种辛辣的回应。
还记得那次他访问印度的时候吗?当谈到印度在AI未来中的角色时,他轻拍这个国家的头,建议它继续做一名忠实的消费者而不是创造者。
来源:印度 Mashable。原文链接:https://in.mashable.com/tech/88879/sam-altmans-rude-hopeless-to-compete-with-us-remark-for-india-resurfaces-internet-says-open-foot-ins
扎克伯格对印度的评论再次在网上引发热议,重新浮出水面的一脚踩空言论引起了网民的关注。
说一个说法像放在烈日下的牛奶一样过时。
我们已经看到,突破性的模型并不需要数十亿美元的预算或斯坦福大学的博士学位——只需要创新、决心,或许再加上一点正义感。下一个AI领域的“泰国餐厅”可能很容易从一个意想不到的角落涌现出来,带着食谱在手,准备彻底改变菜单。
开源项目已经主导了不仅在文本生成领域。图像模型(如Stable Diffusion等)在2022年就已经证明了这一点。现在我们有用于编程辅助、语音合成乃至多模态视觉-语言任务的开源模型。人工智能的前沿领域已经分化成无数社区驱动的项目。难怪OpenAI会这么紧张——Altman从一年前说开源模型“愚蠢”,到现在说DeepSeek“令人印象深刻”[1]。
[1] 根据Tom’s Hardware网站报道。
生活有时候来得太快了。
对于所有 OpenAI 关于利他的 AI 谈论,大卫·萨克斯的批评一针见血:他们“从非营利慈善转变为掠夺性的盈利公司,就像一群小鱼变成了大鱼吃的小鱼一样”。在短短几年内,山姆·奥特曼的团队从理想主义的研究实验室转变为与微软秘密达成交易,给予微软巨大的财务和知识产权特权——比如独家访问 OpenAI 的核心技术(微软独自获得了 GPT-3 基础代码的独家访问权)(微软独自获得了 GPT-3 基础代码的独家访问权),通过 Azure 的优先整合(微软成为了 OpenAI 的独家云领地)(微软成为了 OpenAI 的独家云领地),并且在微软收回数十亿美元投资之前,OpenAI 将向微软支付高达 75% 的利润分成(这意味着回报率可以高达 100 倍,但是有一个上限,意味着一个 10 亿美元的投资可能会获得高达 1000 亿美元的回报)。
OpenAI的剩余创始成员(来源:Perplexity,https://www.perplexity.ai/page/openai-s-remaining-founders-PuccszkJRBO8leL9UJ_Dtw)
所有这些甜蜜的称呼也许还可以说得过去,如果OpenAI有明显的优势,但情况并非如此。
与此同时,Altman的领导正受到来自各方的攻击:他与Elon发生了争执,却发现Elon买下了世界上最强大的政治武器——Twitter,并利用它成为了美国的“花钱大王”通过DOGE。不仅如此,Elon的朋友David Sacks(就是那个发表了食人鱼评论的人)现在成为了AI大员,而Elon Musk正因OpenAI偏离了非营利宗旨而将其告上法庭。甚至OpenAI自己的董事会也在去年因对他领导能力的“不信任”而暂时解除了Altman的职务,直到投资者的抗议迫使他重新上任。此外,已经有8位联合创始人离开了。
这也太乱了吧。
要是我是个赌徒,我会猜测萨姆可能会很快离开当前公司,开始一个新的不受这些麻烦影响的AI公司,他的“Thiel的《从零到一》”创始人故事弧最终不可避免地从英雄变身为反派。
如果那样一来,微软就会一直做它惯常做的事,在“尸体”上“拥抱-扩展”,详见“拥抱-扩展-消灭”策略。
硬件战争:每当模型和制裁涌现时,中国不断推出替代品
Nvidia 当前正处于 AI 飓风的中心,依然是训练大型模型的硅晶霸主,赚取利润的速度如同台积电刻制晶体管般迅速。其最新的 GPU(价格堪比豪车)销售火爆,供不应求,股价图表似乎只懂得一路飙升。然而,在 Jensen Huang 沐浴在创纪录利润的阳光下之时,地平线上乌云密布,预示着风暴即将来临。Nvidia 的垄断地位虽仍屹立不倒,但裂缝正在悄然增多:每一代硬件迅速过时,最大客户可能进行垂直整合,全球芯片供应链因地缘政治而分裂。Nvidia 依然位居榜首,但其根基已经开始松动。
来自雅虎财经
让我们从硬件跑步机开始说起。在人工智能领域,今天的尖端芯片很快就会变得过时。英伟达的商业模式就是这样的——说服所有人,你需要最新的GPU,否则就会落后。但这种过时的速度是把双刃剑。每一代新芯片都使价值数十亿美元的上一代硬件变得有些过时,即使是财力最雄厚的超大规模企业也在预算上感到压力。这像一场永无止境的军备竞赛,要么升级,要么出局。结果呢?即使是英伟达最好的朋友(谷歌、亚马逊、微软等公司)也开始感到疲倦,并寻找退路——英伟达46%的收入来自四家神秘客户。垂直整合是他们的退路。如果你每年需要花费10亿美元购买GPU,为什么不投资其中的一小部分来设计你自己的、为需求量身定制的人工智能芯片?
英伟达H100(来源:英伟达)
谷歌多年来一直在悄悄地用它的TPUs做这件事——这些张量处理器可以处理从搜索到YouTube再到DeepMind的工作负载,而无需使用任何Nvidia芯片。亚马逊的AWS不甘落后,推出了用于训练的Trainium和用于推理的Inferentia,这两款内部设计的芯片旨在降低AWS的成本。据报道,微软正在开发自己的AI加速器(Project Athena),以减少对Nvidia的长期依赖。总之,Nvidia硬件的主要买家正在开发自己的替代品。
Google Cloud TPU V6e(又称Trillium 2)(来源:Servethehome)
这是一道细微裂痕,出现在 Nvidia 的主导地位中,可能迅速扩大:当你的最大客户变成竞争对手,这只“金鹅”很快就会发现自己陷入困境。
然后就是地缘政治的洪流。美国宣布自己扮演起了“天气预报员”的角色,对中国实施了严格的出口禁令,禁止向中国出口高端AI芯片,旨在减缓中国在AI领域的进展。精明的英伟达则巧妙地回应,开发了“对中国友好”的GPU版本(即:稍微做了限制的H100,如H800和新H20,限制了连接能力),以符合这些规定,但依然能向最近为它贡献了近20%收入的市场销售产品。
来源:Nvidia A100 VS H100 GPUnet(文章,点击链接阅读原文)
2019年,华为发布了其顶尖的Ascend 910芯片,采用7nm工艺制造。作为回应,美国政府在2020年将华为列入其实体清单并制裁它。但此举也有一个意想不到的效果:它促使中国更加努力地发展自己的半导体产业。
当各种模型和制裁接踵而至时,中国则提供了更多的选择。
进入华为的昇腾芯片。
几年前,华为的AI芯片被视为新奇事物,适合用来吸引爱国读者的头条新闻,但对 Nvidia 而言,构不成真正的威胁。
不再是这样了。华为公开表示想成为“中国的NVIDIA”,并且最近的进展让他们离这个目标已经很接近了。
华为正在加大其Ascend 910系列的生产,尽管受到制裁。这些不是像苹果的内部消息中提到的虚幻产品,而是真正的大规模部署的硬件。
华为不得不重新设计其Virtuvian芯片块,以便在SMIC使用其N+1技术(第一代7纳米级工艺)重新设计910B芯片以避免制裁,以避开相关制裁。
第二代 Ascend 910B 芯片的最大性能更高,从运行于 320TFLOPS 的 910 提升到了运行于 400TFLOPS 的 910B。它拥有更高的时钟速度,但活跃的 AI 核心数量减少,每个 AI 核心额外增加了一个向量单元,并采用了带宽和容量更高的新型内存。华为在 910 和 910B 系列之间减少了活跃的 AI 核心数量——这可能是由于较低的良率或 SMIC 的 7nm 制造工艺容量有限。
其中50%的增长是由于提高了时钟速度。另外25%可以归因于每个AI核心增加的向量处理单元。两代芯片之间剩余25%的性能提升似乎来自华为峰值性能计算方法的变更。
Ascend 性能表现(来源:Georgetown University)
昇腾910C实际上是将两个910B集成到一起,并达到了800TFLOPS的性能。它基于中国的7nm工艺(中芯国际的N+2节点)制造,但在制裁阴影下——没有EUV光刻技术,很多持怀疑态度的人——依然在推理任务上达到了英伟达H100性能的60%。没错:被制裁的2019年设计,经过升级和重新包装,现在在运行大型AI模型方面也能与同类产品相媲美。
收益率一直很低,这使得由于制裁迫使他们使用较不先进的晶圆厂以及较少的工程师来管理和维护芯片工具,这已经让他们花费巨资。不过,他们正在迅速取得进展。据报道,910C 的良率已经从 20% 提升到了大约 40%,这使得 Ascend 的盈利状况得以改善。简单来说:中国正在通过投入大量的人力、财力和顶尖工程人才来攻克 NVIDIA 的瓶颈。他们最终会成功。如果这一代人不行,那就在下一代人。美国在 AI 硬件领域的绝对领先地位曾是短暂的——这个窗口正在快速关闭。
华为需要至少两年的时间来重新设计并在国内制造第二代昇腾(Ascend)910B芯片,改进幅度不大。
据报道,2024年,华为生产了200000个Ascend 910B处理器,未生产910C。
在今年,他们计划在英伟达禁令期间将910C和910B的产量分别调整为100000和300000。
据报道,台积电非法通过空壳公司制造并交付给华为超过200万片昇腾910B逻辑芯片(Logic Die),这些芯片足够用来制造100万片910C。
训练大型模型时,Nvidia仍然保持明显的领先优势(在软件生态系统、成熟度和可靠性方面,几十年的领先优势短期内难以被赶超)。但对于在AI部署中扮演关键角色的推理任务,华为在这一领域已接近赶上。这里有一个重要之处:华为正大量进入市场。虽然预计会出现一些初期挑战(先进工艺导致的良率问题、具有50亿多个晶体管的芯粒封装的复杂性等),他们正全力提高产量,仿佛是在与时间赛跑。
这种影响已经在价格上显现出来。中国的云服务提供商在政府的“买国产”政策的推动下,已经采用了 Ascend 芯片来驱动他们的 AI 服务。结果是,这些公司的推断成本是西方公司目前无法相匹的。
想象一下叫了辆优步只收了5美分(约0.05美元),这就是在中国做AI推断时的情况。
DeepSeek R1 可在类似 SiliconFlow 的云平台上使用,输入 token 的价格仅为每百万个 token 1 元人民币,折合约 0.15 美元(令人惊叹的价格)。输出 token 的价格则是每百万个 token 4 元人民币,约合 0.60 美元。即使将两者价格相加,每处理一百万个 token 的成本也远低于一美元。
作为比较,OpenAI 的 GPT-4 依靠微软 Azure 的支持,其价格大约是每百万 token 30 美元或更高,这包括了提示和完成的费用。我们说的是大约 200 倍的价格差距。虽然这些模型的能力有差别,但 OpenAI/Microsoft 享受的经济护城河——即他们有足够大的规模来服务数百万用户这一假设——正在被彻底打破。
当一个中国云能够以极低的成本价服务于GPT-4级别的模型时,“AI非常昂贵,因此需要高价出售”的说法就开始瓦解。OpenAI发现自己不希望陷入的价格战中,对手(中国的AI生态系统)并不遵循华尔街的高额利润策略。竞争对手通过补贴或成本优势,几乎免费提供每次调用1000个token的API,而要以0.03美元的价格出售就变得很难。短短几个月间,AI服务的价格底线已经跌到了地板上,而英伟达在硬件上的垄断是原因之一,或者说,是这种垄断开始瓦解的原因之一。
现在,关于DeepSeek R1模型以及为什么每一个AI投资者在一月底都呛到把咖啡喷了出来。如果华为硬件的崛起是这个领域的竞争的一个战场,那么对暴力解题的挑战则是另一个战场。
Deepseek R1 (来自深游R1)(来自:Deepseek)
多年来,人工智能领域的操作手册一直很直接:如果有更大的模型需要训练?那就增加更多的GPU(最好是Nvidia的)。规模、规模、规模——至于效率,管他呢。DeepSeek却给这一做法带来了重大变化。面对只能获取“廉价版”的H800 GPU(Nvidia可以合法出口的中国版H100),DeepSeek的工程师们决定榨出最后一滴油。他们深入底层——甚至到了 比CUDA更低的 层面,直接进入了Nvidia的PTX汇编指令。想了解更多详细信息,可以参阅这篇文章:https://medium.com/@nandinilreddy/deepseek-bridging-performance-and-efficiency-in-modern-ai-106181a85693。
这种是大多数团队甚至连想都不会去想的极度优化工作,因为它极其困难,并且会将软件绑定到特定的硬件上,不具备可移植性。但在中国的紧要关头,不得不采取极端措施。这确实奏效了——效果惊人。通过重新配置代码在H800内核上的运行方式,优化内存访问模式,并将某些任务卸载到通常闲置的GPU部分,DeepSeek 相对于基准实现了惊人的10倍训练效率提升。请注意:不是提高10%——而是提高了10倍。他们将每个H800变成了类似增强版H100的设备。仅用2048个GPU和一个临时的小团队在一个边角项目上工作,DeepSeek 在大约两个月的时间内训练了一个拥有6710亿参数的混合专家模型(DeepSeek R1)。详情可参见原文链接。
作为比较,Meta 需要大约 2,000 块顶级的 Nvidia A100 GPU 来在类似的时间范围内训练其拥有 650 亿个参数的 LLaMA 模型。DeepSeek 在硬件使用效率上高出一个数量级,模型参数量达到原来的 10 倍。这就像电影里的一个场景,音乐戛然而止,所有人都停下来看着彼此,低声说:“等等,这 可能 吗?”本来不应该这样,但他们还是做到了。
DeepSeek的成就对英伟达造成了打击:其市值。当投资者意识到一家贪食的初创公司仅使用较少的英伟达芯片就完成了巨大的人工智能任务时,“无限GPU需求”的叙事受到了冲击。英伟达的股价此前一直在呈抛物线上升,每次有人提到人工智能炒作,突然开始下跌。短短几天内,英伟达的市值蒸发了大约866亿美元。
现在,股票波动往往是过度反应,但从象征意义上来说,非常明确:仅仅依靠最强算力来获胜的时代可能即将结束。优化是新的扩展方式。当一个巧妙的技巧或算法改进可以帮你节省90%的计算预算时,你会注意到这一点。而如果你忽视了这一点,你的竞争对手不会。即使是适度的2倍效率提升——甚至仅仅20%——在全球人工智能部署规模上也是一场变革。这相当于需要五个数据中心而不是四个,或者在GPU上的花费为1亿美元而不是8000万美元。这些数额决定了季度收益的盈亏。DeepSeek证明了强力计算可以被智胜,并且通过这样做,它削弱了英伟达不可或缺的光环。
总结一下,我们会看到什么?AI硬件领域的碎片化趋势已经初现端倪。就在一年前,人们或许会认为英伟达几乎在AI硬件领域无人能敌——他们的GPU几乎出现在每一个AI实验室和数据中心中,CUDA成为了AI领域的标准语言,而挑战者则被视作不值一提的学术研究或是小众领域。当赌注如此之高时,事情变化得有多快。我们正在迅速进入一个分散化、多极化的AI硬件新时代。在一方,英伟达的GPU依旧占据重要地位——它们将继续成为许多任务的首选,而Jensen无疑会推出更强大的硅芯片(如Blackwell及其后续产品)和改进的软件。
垄断时期的辉煌正在逐渐消失。在另一个角落,我们有“China Inc.”,以华为(以及其他紧随其后的公司)为代表,它们正在走出一条独立的道路——这条道路优先考虑的是自给自足和规模,而不是追求尖端技术的霸权。它们在绝对性能上可能稍有不足,但会在数量和成本上弥补这一点,并且不受西方控制。而在另一个角落,大型云服务提供商和一众初创公司正在打造一个庞大的集合,里面装满了各种新型芯片:TPU、IPU、NPU、模拟芯片、光子芯片——种类繁多,每一种都针对特定的工作负载或效率目标进行了优化,以实现最佳性能。
仿佛人工智能计算的世界分裂成了多个平行宇宙,所有的一切都在各个地方,任何时刻,无处不在地发生着,仿佛“同时”在展开。
Nvidia与中国AI芯片的比较(来源: KB证券,Jukanlosreve)
这种分割现象并不是创新放缓的迹象;而是商品化和民主化的迹象。计算正在变得商品化,意味着所有人都能以某种方式获得强大的人工智能计算能力。当多个国家和公司都能大批量生产“足够好”的芯片时,没有任何一方可以垄断市场。价格将下降;利润率将缩小。(英伟达不会永远以4万美元的板卡销售——竞争将阻止这一点。)与此同时,真正的差异将从纯粹的计算能力转移到如何巧妙地使用计算能力上。这就是优化成为新的范式的地方。DeepSeek的教训将被铭记:与其只是投入金钱和硅解决问题,不如投入智慧。让算法更精简,软件更紧凑,硬件更专业。这在某种程度上回到了早期计算机时代——当时效率很重要,因为硬件有限。现在硬件虽然广泛存在但仍然昂贵,因此效率再次变得至关重要。
到这个动荡的十年结束时,全球人工智能硬件格局将不再是一个单一的模式。它地缘政治上将分化为一个由美国主导的领域、一个由中国主导的领域,以及可能加入竞争的其他领域(例如欧洲、印度,或诸如此类的国家)。它将从技术上变得多样化——GPU将与ASICs、FPGAs以及从其他未知的新架构共存。它也将更加具有韧性——没有单一的故障点或控制点,没有可以被利用来阻碍进展的单一瓶颈。尽管Nvidia的GPU仍将非常重要,但不再是唯一的选项,你不会愚蠢到完全排除它们的可能性。一刀切的通用GPU主导时代已让位于遍布全球的专用和优化计算拼凑而成的格局。
归根结底,人工智能领域的硬件战争不会产生一个单一的赢家。相反,它打破了曾经统一的局面,催生出一片丰富而混乱的雨林般替代方案。每个生态系统——英伟达、华为、谷歌、开源项目——各自进化以适应其生态位。而讽刺的是,这种多样性将比单一垄断更快地推动人工智能的发展。这场风暴已经到来,正在颠覆各种假设。
对于在场外观察的人们(比如投资者、研究人员和政策制定者)来说,有一件事是明确的:人工智能的未来将建立在全球分布的硅网络上,而谁能够更聪明地使用它而不是仅仅拥有最大的芯片,将决定谁将在下一章节中领先。
AI 模型训练成本对比(来源:Dogesator / Reddit(Reddit网站),来源:Dogesator / Reddit)关于训练成本的常见误解
DeepSeek 实现的10倍训练效率提升,即使使用仅2048个NVIDIA H800 GPU,也仅用两个月就训练好了一个6710亿参数的模型。相比之下,Meta或Google通常会投入20000个GPU。
DeepSeek通过智慧而非力量有效地抵消了NVIDIA硬件的优势。通过这样做,他们证明了全球GPU短缺问题和美国对GPU的出口禁令至少可以部分通过智慧和努力绕过。
如果有一个人能做到这一点,其他人也会跟着做。我们将看到一波“PTX级别的优化浪潮”,中国每一个主要的AI参与者(以及可能还包括俄罗斯),甚至包括西方那些渴望成功的初创公司,都会尽可能地优化他们在市场上能获得的硬件性能。这将进一步削弱英伟达的事实上的垄断地位,并加速AI计算分散的趋势。
已经,替代 AI 芯片的初创企业(从美国的 Cerebras 到中国的 Biren)嗅到了血腥气息。到 2026 年,AI 硬件领域看起来会大不相同——包括 NVIDIA、国内的 AI 加速器以及为本地模型优化的新型架构。不管怎样,NVIDIA 都不会像过去那样拥有垄断地位。硬件战争正在把世界分成不同的阵营——讽刺的是,这也促使所有人更加注重 效率 而不是单纯依赖蛮力。
Cerebras晶圆级工程与最大GPU的对比(来源:Cerebras官网)
最后的一个转折:虽然全球对推理计算的需求无疑会大幅增长——受到我们尚未大规模部署的人工智能应用浪潮的推动——最关键的问题是这种计算会在哪里进行。随着推理计算从集中的云端迁移到边缘(想想智能手机、汽车、工厂和遍布四周的传感器),如今许多大型数据中心的建设项目可能会突然变得不那么有战略意义。我们目前正目睹一个典型的繁荣与萧条场景:超大规模云服务商竞相在足球场大小的区域里堆满GPU机架,如果重心转向边缘的分散推理,可能会出现需求过剩的情况。
仍然值得记住我所说的斯克罗吉法则(如下链接所示):计算需求总会扩大到填满所有可用的数据中心,无论你建多少个数据中心。正如我在LinkedIn上的帖子中提到的(https://www.linkedin.com/posts/craigscroggie_goldman-sachs-research-newsletter-activity-7218221826051645440-bVXi),这句话强调了“无论你建多少个数据中心,计算需求总会填满所有可用的数据中心”。
AI代理的兴起:边缘智能嵌入聚焦云端的大规模AI模型固然重要,但或许更深刻的转变在于智能正向外扩散——进入实时代理、设备和边缘。我们正从一个时代进入另一个时代,在这个时代中,AI不再是简单的“调用API获取答案”,而是嵌入到你需要它的每个角落,通常是在本地运行,自主且不间断。这种转变具有重大影响:它颠覆了AI集中于云端的统治地位,改变了软件开发的方式,并有望在无数云端大型模型难以触及的领域中大幅提升生产力。
在2023年,大家都在热议的是浏览器中的ChatGPT。到了2025年,热议的话题变成了AI助手在方方面面的应用:你的车、你的冰箱、你公司的客户服务。这些都是专门的AI助手——它们不仅被动响应指令,还会主动行动、观察、规划并实时执行任务。
早期的实验,比如AutoGPT和BabyAGI,都比较笨拙,只是概念验证,但它们点燃了热情。现在我们已经部署了更成熟的版本。
在我的公司,Freelancer,我们建立了一个AI代理框架来处理一级客户服务和销售咨询。这些代理可以与客户用自然语言交流,回答问题,解决故障,甚至推销我们的服务——所有这些都不需要人工干预,直到某个特定阶段。我们还为其他公司提供类似服务——预计在未来两年内,全球每家小企业都将利用AI来接听电话、预约、处理信用卡支付和订单——更多信息和演示,请访问 freelancer.com/ai。
而这里有一个引人入胜的发现:这些代理增强了我们的团队,接手了繁琐的任务,并在遇到瓶颈时为团队创造了新的任务,从而实际上增加了我们的总就业量。
这看似不合常理但实际上合情合理——AI处理了1,000个人类单独处理会不划算的简单工单,但在这个处理过程中它发现了100个需要更高级别人工处理的情况(从而产生了本不存在的工作)。我们实际上雇用了一支不知疲倦且快速的初级团队,在需要时将问题提交给(人类)经理处理。这只是客户服务中的一个实例。
除此之外,我们现在还有净新增的产品小组专注于框架的开发——至少在我们的情况下,至少目前来看,就像之前的那些技术一样,它们创造的工作机会比被破坏的还要多。
现在将这种模式扩展到各个行业。每个涉及常规通信或数据处理的业务流程都适合由AI代理自动化。我们说的包括销售电话、技术支持、人力资源入职、内部帮助台、研究分析和个人助理等。正如我在之前的Macrovoices访谈中提到的,在房地产行业,想象一下一个AI代理处理所有烦人的租赁物业相关电话——租户来电报告故障水龙头,安排维修,以及更新房东信息。
AI开发服务的展示可以在Freelancer.com/ai网站上体验——试试看!
一个AI可以对所有这些进行优先级排序和响应,仅在进行实际物理维修时才引入人类协助。或者考虑医学领域:AI“转录助手”已经监听患者的就诊情况并起草临床记录;下一步将是一个AI代理,可以进行初步的患者接待和问诊,询问症状,并可能给出初步诊断供医生参考。这并非科幻——它的部分功能已经实现。如果政府允许ChatGPT来编写脚本,这可能会释放出全国一半的全科医生去从事更高价值的工作。
至关重要的是,许多这类代理应用需要实时或现场 AI。你可能不想让云端服务器处理敏感的商务电话,如果本地 AI 可以做到没有零延迟和完全私密的话。此外,正如我在《你知道,AI 知道你去年夏天做了什么》中提到的,随着 AI 功能越来越好(甚至更令人不安),我认为 SaaS 即将迎来它的“皇帝的新衣”时刻。
你会越来越多地看到消费者和公司表示“我不希望我的数据留在互联网上,我不希望AI把这些数据吸入,我不希望AI了解我的用户,我不希望它们了解我的商业模式,我不希望我的研究立刻被商业化”.
你可能会看到互联网大规模瘫痪。
我只是现在打开你的 Gmail,自己想想……
谷歌的AI系统已经知道了里面的每一件事!!
他们骗你说他们根本不看这些数据,但其实他们会根据这些为你推送相关广告。
嘿,谷歌,你能帮我说说怎样才能更好地跟上我的公司的步伐吗?
嵌入式推理 的热潮已经全面加速。就像个人计算机革命的第一阶段一样,我们现在正将AI从中央数据中心推向个人和边缘设备上。嵌入式推理指的是在本地设备上(如手机、笔记本电脑、本地服务器上、汽车上)运行AI模型。
2024年,高通展示了在智能手机上运行大型语言模型;到了2025年,越来越多的消费设备出厂时自带设备端AI功能,而在此之前这些功能需要互联网连接才能实现。苹果的神经引擎和谷歌的张量芯片——它们都被用来直接在你的设备上运行模型。正是开源技术使这一切成为可能的,通过模型压缩技术(如量化和蒸馏),人们可以将2022年的130亿参数模型压缩到可以轻松地在今天的1000美元笔记本电脑上运行的程度。
这种情况下的云AI主导地位的终结对于某些大型科技公司的商业模式来说是一个噩梦般的情境。如果重心转移至边缘,云AI提供商可能会发现他们的增长遭遇瓶颈。为什么要为每次调用或每月使用API支付费用,而你可以拥有一个在本地运行且无需持续付费的模型呢?
边缘智能与云智能(来源:Murata)
我们已经可以观察到一些早期迹象:一些聪明的公司正在对开源模型,比如Llama 2,进行微调,使用自己的专有数据,并在内部运行这些模型——不需要OpenAI或Azure的支持。这样做成本大幅降低。现在,中型公司可以拥有自己的类似于GPT的模型,根据自身需求进行定制化,而且泄露机密信息的风险大大降低。这大大削弱了“AI即服务”(AI-as-a-service, ASS)模式。想想,有多少人在输入内容到ChatGPT之前会三思呢?
我甚至有几个朋友每次和ChatGPT聊天时都特别客气,这样当SkyNet有了自我意识时,它还能记得这些人。
边缘AI也预示着软件开发的复兴期。开发者不再将“AI”视为一个独立的事物,而是将其视为应用程序中包含的另一个库或运行时。下一代应用程序将核心集成AI功能。想象一下打开Excel,不再只是看到静态公式,而是在表格中看到一个能够分析数据、建立数据透视表、生成预测和标记异常的AI代理——所有这些都在你的CPU或GPU上运行。微软已经在Office 365 Copilot中朝这个方向迈进,但现在它还是调用云端。再过一两年,你的电脑很可能直接在本地处理许多这样的推理任务,特别是在处理较小规模任务时。
这里有一个有趣的推论是垂直AI代理的崛起。随着通用模型变得商品化,价值转移到了如何在特定场景中使用它们。一个在供应链物流、医疗计费或法律合同分析方面成为专家的AI代理——这些是可能基于商品化的模型,但通过领域数据和流程整合而增强的垂直解决方案。赚钱的关键在于如何将AI部署到解决特定痛点上,而不仅仅是拥有最花哨的模型。我之前说过:真正赚钱的地方在于将AI应用于各个行业,就像在互联网时代,赚钱的方法是将每一家企业都搬到线上一样。我们正在见证这一点的发生。每个行业都将有自己专属的AI助手和代理,而互联网上的数据集将变得既新颖又公开(你还能像以前一样从ArtStation上抓取训练数据吗?)。
许多垂直服务将在本地运行或在专用设备上运行,这是为了可靠性、低延迟和保密性。
一些AI代理的选择(来源:Reddit)(摘自Reddit)。垂直领域SaaS
也要考虑自主性这个方面。这些代理不仅仅是问答机器人,它们可以采取行动。我们实际上让软件具备了一定程度的决策自主性,这种自主性过去总是由人类来决定的。这很强大,但你必须确保代理所做的正是你所期望的。如果有一个领域我建议谨慎行事,那就是在没有约束的情况下释放自主代理。我们从第一波浪潮中得到教训(一些AutoGPT用户发现代理会无休止地循环或做出愚蠢的事情)。下一波浪潮,希望我们能够构建出具有更稳健目标和防止做出愚蠢事情的安全检查(例如,AI旅行代理可能会给出过多折扣,或者应要求为人们做数学作业)。
自主的AI代理可以执行交易、发送电子邮件,与数据库交互,控制物联网设备。这带来了一系列新的机会和风险。一家交易公司可能有一个AI代理来监控市场状况,并比任何人类更快地执行策略。一家工厂可以拥有一个能够动态调整运营的AI控制系统。一个安全摄像头将对场景中的所有情况了如指掌,并能够通过面部、步态和其他特征反向查询每个人的身份。
然而,精灵已经从瓶子里出来了。自主的人工智能代理会一直存在,并且只会越来越强大。如同机器人或软件权限这样的现实世界执行器与人工智能大脑结合形成了一种反馈循环:人工智能可以尝试某件事,观察结果,并从中学习——这是一种朝向目标的迭代的初级形式。这并不是自我意识的“天网”,它并不需要具备自我意识就能革新工作流程。一个设计得当的客服机器人,不断从成功的和失败的互动中学习,一年之内就能超越整个外包呼叫中心的表现。
总结来说:我们正在将人工智能去中心化和专业化。那种能做很多事情但表现一般的大型云端模型正被一群更小、更专注的代理所取代,这些代理更贴近实际使用情况。这种转变类似于从大型计算机转向个人电脑,或从单一应用转向微服务架构。这改变了谁能够获得价值(预计边缘装置的制造商和聪明的集成商将受益,而云端使用量增长可能会放缓)。这也挑战了“AI = 大型数据中心”的观念。再过几年,这可能听起来像过去的互联网模式一样过时。
GPT:政府恐慌大戏
如果你觉得扩大神经网络和硬件军备竞赛已经够混乱了,那么等着瞧,看看政府们正在准备些什么。美国禁止向中国出口芯片;中国禁止某些人工智能软件出口;欧盟正在讨论是否强制“GAI”模型需要政府许可;等等。欢迎来到全球马戏团:人工智能民族主义撞上了官僚主义的搞砸。
AI民族主义现象,(来自:TheNextWeb)
欧洲正在前面跑,领先一步,正以前所未有的《欧盟人工智能法案》(https://artificialintelligenceact.eu/)向前迈进,这法案深受他们惯用的“预防原则”驱动——简单来说就是先管后创。这正体现了欧盟的一贯作风:彻底禁止某些用途,同时对“高风险”系统施加重大的合规要求,高昂的合规成本,广泛的限制,繁琐的文书工作,以及高达3500万欧元或全球收入7%的巨额罚款(足以让小国破产)。欧洲可能会通过过度监管而使自己变得无关紧要,将整个大陆变成一个数字主题公园,而其他国家和地区则在真正构建AI的未来。
相比之下,美国坚持其“快速行动,打破一切”的原则,通过行政命令、指南和自愿框架来发布AI规则。这是一种轻量级的美国式监管——依靠硅谷的自我监管,同时又担心没有紧急刹车键,至少是没有一个“关闭开关”——他们还没找到在不引发经济危机的情况下安装它的方法。拜登的行政命令基本上是温和地要求科技巨头们公平行事,分享研究成果,并对深度伪造作品添加水印。与此同时,国会以龟速讨论AI监管,希望在其监管下不会发生任何灾难。
中国的策略再明确不过了:快速创新,更快地审查(即:作为首个全面的人工智能监管措施,体现了中国积极主动的立场)。北京的新规要求人工智能必须维护“社会主义核心价值观”——这一点毫不令人意外。每一字节的人工智能生成内容都被监控、过滤,并且忠实地标注为“中国制造”。与西方同行不同,他们甚至不假装自己不在监视。如果用户通过某种方式诱使人工智能生成被禁内容,提供者必须立即停止生成,删除输出内容,并向有关部门报告详情见此处。这不仅仅是监管,更是具有中国特色的人工智能——高效、创新,而且绝对在掌控之中。
这种三方拉锯战——欧洲谨慎的福利主义国家、美国的自由放任式创新精神和中国的权威主义管理模式——正在撕裂人工智能生态系统。公司现在必须对其模型进行地理围栏,维护独立的中国版本,并内置审查功能,同时还要应对这些美国对硬件甚至模型的出口管制(甚至分享一个权重文件也可能需要商务部许可)。
AI初创公司面临着合规难题,全球平台变得像精神分裂症患者,根据你的护照改变个性和功能。我们正走向一个碎片化的人工智能格局,被分割成欧盟的围墙花园、美国的开放但充满风险的游乐场以及中国的国家控制的数字围墙。
正如《经济学人》在2024年初所言的那样,“欢迎进入AI民族主义的时代,”世界各地的主权者竞相掌控各自的科技命运。
这其中的一个变数是开源AI人士。他们使基础模型变得普及,打破了大型科技公司的专有壁垒,让这些壁垒形同虚设。这让监管者不知所措。欧洲试图将其纳入监管,但很快意识到,监管数千个去中心化的AI项目就像试图管理数字下的猫。美国赞扬他们的创新(但私下里担心会被滥用),而中国基本上不理会他们,相信其防火墙能够过滤任何潜在麻烦的创新。
与此同时,政府正争相应对深度伪造、信息造假和数字身份等问题。一些政府则危险地尝试强制性数字身份验证(即互联网上的“了解你的客户”),这可能破坏在线匿名性。
我不久前推测过,如果坏人手中出现了一个被破解或失控的ChatGPT,可能导致政府加强对互联网的管控——更多的监控和言论限制等。这种前景已不再只是假设。看看西方政府在选举和新冠疫情相关的虚假信息面前是如何反应的——常常反应过度,偶尔侵犯公民自由。现在把这种恐惧放大十倍,考虑到AI的介入(“想想恐怖分子会如何利用失控的GPT!”),你就能明白这种情形了。
一种特别严厉的提议正在流行——作为解决人工智能信任问题的“解决方案”——是“互联网上的KYC”或直接解释为“互联网身份验证”。用通俗的话来说,就是“上网通行证”,要求每位用户在上网前验证真实身份(可能需要出示由政府颁发的身份证明),以打击大量AI机器人和深度伪造的恶意账号。这将迫使每个互联网用户在发布或访问某些内容之前,必须验证其真实身份,以此来阻止AI机器人和深度伪造的恶意账号。
澳大利亚的政治阶层——无论是执政的左翼工党还是右翼的自由-国家党联盟——都可耻地团结起来,实施实际上是一种“互联网实名制”,这种措施被狡猾地宣传为“保护儿童”的手段。特别令人愤慨的是,长期宣称自由言论是基本原则的联盟党,对此立法表现出极大的热情。丑陋的现实是,这项法律与儿童安全关系不大,只是想让那些在网络上批评政客的人闭嘴。
这个概念以前只存在于极权主义的策略中,现在却渗入了主流西方讨论。支持者认为,这是区分推特账号上那些胡言乱语是真人还是AI的唯一方法,也是唯一有效的方法是追究恶意部署生成式模型者的责任。我理解这种诱惑——网络上充斥着冒充账户、机器人和人工智能生成的虚假信息,情况可能恶化一百倍。但让我们现在就揭穿这个“解决方案”的真面目:牺牲匿名性和隐私并不是真正解决人工智能滥用问题的方法。要求每位用户都用护照或指纹登录并不能解决人工智能的问题,它只会作为附带损害扼杀自由的网络。
然而,我觉得我们可能正朝那个方向前进。坦白说,技术上的应对措施已经不管用了。我们尝试过让用户点击交通灯来证明你不是机器人——现在人工智能已经能解决这些验证码了。我们也试过让用户拿着身份证自拍来验证身份——现在人工智能甚至可以伪造这种视频。我们很快就会达到一个任何数字认证很快都会被足够高级的人工智能给骗过的地步。
正如我之前演讲中严峻地指出的那样(点击此处观看),我们可能很快就没有可靠的方法来在线验证人的身份了。这将是一个即将来临的社会危机。政府的回应可能就是加强验证措施:也许对所有内容进行加密签名验证,或者要求所有AI生成的内容都需带有水印(试试看吧)。或者强制每个用户在他们的行为中添加一个经过验证的身份令牌。每一种措施都将伴随着巨大的公民自由问题和实际难题。
在网上,谁也不知道你是不是生成式AI(来源:Jon Dron)
所有这些监管还有一个致命缺陷:AI的发展速度如同光速一般快,而官僚机构却行动缓慢如蜗牛爬行。等到法律跟上时,模型已经进化到几乎不被认出。这种“速度差距”意味着我们一直在对昨天的技术进行监管。例如,欧盟的人工智能法在GPT-3还是顶尖技术时制定,但直到GPT-6出现才完全生效。这就像在汽车发明后,仍然试图管理马车一样。
所以我们就在这里:在一个无法信任任何东西的互联网上,什么都不能轻信——不论是文字、图片,甚至一个人讲话的视频——而我们的领导层最好的主意似乎是上网时每个人都得出示身份证明。监管的表演碰上了技术的大流行。
我没有完美的答案,这是事实。这是一个前所未有的挑战。但是我要说的是:由恐惧驱动的严厉监管往往矫枉过正,造成的损害甚至超过问题本身。全球混乱的AI规则可能会导致许多意想不到和不一致的结果,至少在短期内。一些司法管辖区可能会矫枉过正(扼杀创新),而另一些则可能矫枉失度(纵容混乱的使用)。在这两者之间,企业和用户在努力合规时会感到困惑。接下来两年的监管局面将非常混乱。预计会出现法庭挑战和贸易争端(“你的AI法规让你的公司在市场上占优势!”),以及公司有时会说“见鬼”并将代码开源或迁往海外以规避规则。
接下来的几年将会是充满波折的时光,因为这些相互竞争的监管理念将会直接冲突。AI民族主义已经兴起,规则正在分裂,而创新则在没有束缚的情况下快速发展。最终,那些能够妥善平衡——拥抱创新,同时保护隐私和自由的国家——将塑造下一个十年的面貌。目前,一切都是一团糟,合规要求永无止境。
欢迎来到AI监管时代。
合成的互联网:信任危机假消息(来源: Wikipedia).
在2023年,一张由人工智能生成的图像在网络上迅速传播开来,图中好莱坞标志被野火包围着。这张图片完全是假的,但却极其逼真,骗过了数百万人,直到被揭穿之前。欢迎来到这个合成的网络——在这里,现实与伪造混淆不清,无缝交织。
在人工智能的惊人奇迹背后,一场更为深刻的风暴正在酝酿:我们的整个信息生态系统正在崩溃。在线世界迅速被合成内容淹没着——人工智能生成的文章、图片、视频,甚至难以分辨真假的虚拟人。到了2024年,这现象从涓涓细流变为滔天洪水。到了2025年,我敢说到那时,网上大部分内容都会是机器生成的。我之前讨论过“死网理论”——认为互联网上的许多内容早已是假的或由机器人生成——我们现在正亲眼看到这一理论在现实中上演。
拿一个简单的例子来说:社交媒体。刷你的 Facebook 动态,你可能会觉得有些不对劲。一些奇怪的账号发布了奇怪的图片,比如一张有点“怪异”的房间内部设计照片,看起来几乎真实却又有点不对劲。下面有上百条评论,评论者的头像是用 AI 生成的。
来自Facebook,有很多机器人程序。
或者那些突然涌现的、非常特定的兴趣小组,讨论活跃,感觉算法推荐非常精准。这并不是科幻情节——它正在发生。社交网络上的很多活动是由机器人操控的,通常是为了广告欺诈或垃圾信息互动。人工智能大大加速了这种趋势。这些机器人现在可以说出无数可以信服的话,分享无数伪造的图片。它们可以凭空捏造出整个社区。仿佛数字幻影剂被注入了我们的信息供给中。
来源:来自 WasitAI.com
但影响远不止于此,比如垃圾信息和骚扰。
我们正陷入一场信任危机。
你看到一篇看似来自CNN的新闻文章——但实际上完全是由AI撰写并为了吸引点击而生成的。你看到一段视频,显示世界领导人发表了荒谬的言论——但这其实是一个深度伪造。接到一个电话,你女儿说她被绑架了,需要钱——其实那不是你女儿的声音,而是AI克隆了她的声音,骗子利用这一点来诈骗你。
所有这些例子在去年都已经发生了。现在想象一下这种情况的倍增。生成虚假信息或欺诈性内容的成本几乎降至零,而这些内容的质量和逼真度却在急剧上升。这简直就是一场认知危机的完美风暴。
可以看看Freelancer.com/ai上的 некоторые演示,你会发现与AI代理的语音通话体验有多棒。
(Note: There seems to be a leftover Russian phrase " некоторые演示" which appears to be a translation error. Correcting it:)
可以看看Freelancer.com/ai上的 一些演示,你会发现与AI代理的语音通话体验有多棒。
当我们面对数字内容时,我们已经无法再相信自己的眼睛和耳朵了。如果所有的信息都变得可疑,会发生什么?我们可能会陷入一种集体的幻觉状态,公共讨论因为没有人知道什么是事实而恶化。现在,骗子和宣传者正在利用这种不确定性(“除非我们说它是真的,否则不要相信任何东西”)。我们看到独裁者将真实的证据称为“深度伪造”以逃避责任,而与此同时,活动家们试图揭露真正的深度伪造以防止不实的恐慌。
信息战已经变得非常激烈。
这就像那个大喊“狼来了”的男孩。但这里有无数的狼和无数的孩子。最后村民们只是耸耸肩,不再对任何事情做出反应,无论是真实的还是虚幻的。或者更糟糕的是,他们选择相信他们想相信的,事实如何根本不在乎,因为客观真理已经变得模糊不清。我们已经深陷于这个主观现实的时代;由AI生成的内容可能是共识真理的最后一击。
科技公司正在采取一些措施。OpenAI 开发了一个(基本上无效的)分类器来检测 AI 生成的文本——这基本上不起作用,他们已经停止使用它(这基本上不起作用)。
谷歌于2022年。(来源:Nick Saraev)破坏了AI生成的内容排名。
连谷歌都阻止不了AI生成的内容在网络上的流行,一开始还警告说用这些内容会在搜索排名中被降级,但最终还是放弃了这个态度——既然斗不过,不如就和他们一起玩——也开始提供AI生成内容的工具。
2023年的谷歌。 (来源:Will Scott)
研究人员正在为AI生成的图像和视频开发水印——但任何这样的水印都有可能被移除或伪造,尤其是在存在多种模型架构的情况下(恶意行为者可以使用不生成水印的模型)。像Adobe领导的内容真实性倡议这样的努力旨在在内容创建时对其加密签名(例如,当你拍摄一张照片时,你的相机对其证明其出处)。这也许可以解决新生成内容的问题,但无法解决数以亿计的旧图像和视频被重新利用的问题,也无法强制不良行为者使用能够签名假内容的硬件。
内容真实性计划,来自Adobe
说实话,我真不想这么说,但现在唯一理性的态度是,除非被证实,否则都得假设所有数字化的东西可能是假的。这真的难以接受。想象一下把这种标准用在日常生活中——每封邮件、每次视频通话、每条新闻都先假设是有问题的,直到被证明是无误的。这既累人又有破坏性。
在我的MacroVoices 讨论里,我强调了早期迹象已经显现。2022年,博客垃圾信息(spam)和SEO内容农场利用GPT-3大量生成低质量文章。到2024年,整个网站都是AI生成的垃圾内容,以AI撰写的耸人听闻的标题吸引点击。即使是经验丰富的分析师也被AI伪造的研究报告或假访谈欺骗过。合成互联网悄无声息地靠近你;除非你主动寻找,否则你可能不会注意到你读到的某些Medium帖子实际上是GPT-4写的,经过了一些人工润色。
最可怕的部分是当合成内容被故意用来造成伤害。我们已经看到国家支持的误导信息运动利用AI来扩大其影响并定制信息内容。这现在不再是数千名网络喷子——而是一个人利用GPT-4自动化制造一万个假身份。
2025–2026年人工智能预测——这里的所有预测
模型的商品化与专有优势的终结
开源模型正在像兔子一样迅速增多,正在侵蚀曾经由像GPT-4这样的封闭系统所占据的高价位优势。很快,没有一家大型企业会愿意为访问通用模型支付高价费用——现在专业性和应用场景的重要性愈发凸显。对于OpenAI来说,接下来将面临巨大的挑战。我猜测Altman可能会因为沮丧而气得退出,并趁着自己还有威望时创办一家新公司,而剩下的OpenAI则会被微软吞并。
不管你喜不喜欢,大型科技公司(如谷歌、微软等)都在广泛应用人工智能
预计微软、谷歌和亚马逊会将人工智能集成到你使用的每款软件中——强制性的CoPilot功能集成,以AI为主导的Salesforce界面等。AI不再是附加功能;它现在已经是你的默认选择。准备好迎接那些盲目添加AI功能而不知如何操作的公司的尴尬失败吧——这可能会引发类似“皇帝的新衣”那样的情况,促使人们纷纷逃离云端,转而使用本地运行的AI。
GPU从短缺变为过剩;硬件碎片化现象开始出现
今天的 Nvidia 缺货将会变成明天的供过于求,随着训练需求趋于平稳,而边缘计算却在迅速增长。与此同时,中国的本土芯片崛起,打破了 Nvidia 的近乎垄断局面。
监管乱象与“认证用户”时代的到来
准备好迎接更多的混乱的人工智能立法——很可能首先来自欧盟——这将可能带来巨额罚款,并让合规部门忙得不可开交。注意可能出现的严厉措施,如数字身份和内容认证,以及由此引发的公众强烈反弹。“认证真人”徽章可能紧随其后,因为你在Instagram上看到的那种失业模特穿比基尼的照片将被无数难以分辨的人工智能生成的诱惑照片所取代。
AI代理,改变工作方式——人类向更高层次发展
别再想着那些静态的聊天机器人;AI代理成为你的新同事,大幅减少了诸如客户支持和销售等重复性工作的负担。人类不会消失,反而会监督AI或处理棘手问题。向诸如“AI工作流程设计师”或“AI审计员”这样的新角色说声你好。个人助理如Alexa终于变得聪明了,能做更值得你做的任务。
Netflix与AI内容过剩
Netflix 即将感受到维基百科在 ChatGPT 推出时的那种被淹没的感觉——一个曾经叱咤风云的内容巨头突然陷入无尽的人工智能生成的模仿作品、失控的粉丝小说和零边际成本生产的合成衍生品的海洋中。这些作品。当一夜之间,成千上万的青少年利用过剩的 GPU 和空闲时间生成的人工智能衍生作品涌现时,祝你在收费订阅方面顺利。我们终于可以修复《权力的游戏》第八季的缺陷,但也会有更多,比如第九季、第十季、第十一季等等,太空版、西部版,你甚至可以成为主角,而你的朋友们则将扮演角色。
互联网的真实性危机:互联网的现实考验时刻
随着AI在网络上泛滥出大量逼真的假内容,信任度跌至谷底。真实性变得越来越珍贵——预计初创企业和平台提供的“真实验证”内容的业务将呈爆炸式增长。本地调查性新闻业已经卷土重来,因为媒体组织难以产生原创内容。要注意可能出现的重大 deepfake 事件引发的危机,促使政府将某些欺骗性AI内容定为犯罪,并借此获得更多对选民的管控。
经济赢家和输家及生产率的提升
适度的生产率增长终于在宏观经济数据中显现出来,这让经济学家感到困惑不已,因为尽管工资上涨,通胀却依然保持在低位,这更让经济学家感到困惑。大规模低成本劳动力中心的外包业务正在减少,因为像呼叫中心这样的大型就业地点受到了干扰,这些地方的业务模式也在发生变化。与此同时,像医疗和教育这样的行业——以前对技术接受度较低——开始因为实用的人工智能整合而加速前进。
AI驱动的自由职业者热潮
AI 正在点燃了全球自由职业市场的热情,让技能在一夜之间得到飞跃,并释放了来自世界各地的才华。配备了先进的工具,比如实时 AI 助手、多语言翻译器和专家级的写作和编程助手,来自新兴经济体的自由职业者现在能够以闪电般的速度交付顶级作品,这些作品往往与纽约或伦敦资深专业人士的作品不分上下。
西方工人的地理上的优势正在迅速消失;企业现在能够轻松找到更聪明、反应更快且成本低得多的全球人才。这就是一个无边界、高度竞争的市场时代的来临——要么快速适应,要么准备好被超越。
所有工作都按优先级提升,小微创业的爆发既推动了也促进了由AI带来的变革。
社会反弹现象与政治与人工智能的较量
就像有机食品变得时尚一样,预计会出现文化反弹:“人手制造”标签随处可见。从政治角度来看,AI 成了一个分歧点——“人工智能偷走了你的工作”之类的演讲即将到来。年轻人轻松应对;而年长一代则抵制,试图在可接受的人工智能使用边界上进行艰难的辩论。如果允许 GPT 来开处方,全科医生一半的工作可能会瞬间消失,而可能有 70% 的心理治疗工作也会消失,而且效果会更好。
黑盒子之谜:AI 总是让我们大吃一惊
新兴能力继续让即使是创造者也感到困惑。AI的黑箱行为促使研究透明度和监管的加强。准备好迎接更多“它自己学会了什么?”的时刻,这将推动更严格的监管措施。我使用Claude Sonnet 3.5写营销文案,以及用GPT 4.5做深度研究时,再次有了那种感觉。
公共叙事影响现实 — 聪明人的机会
普通人往往会低估人工智能已经深深嵌入日常生活中的程度,从而让精明的投资者和技术专家占据了优势。人工智能不会消失在新闻头条中,它只会悄悄地融入日常生活,就像电力一样成为基础设施。
人工智能风暴正在肆虐,从地缘政治到日常的工作都在被重塑。是时候稳住脚跟,迅速适应变化,迎接接下来的一切。
疯城
如果有一件事是肯定的,那就是世界即将一头栽进疯狂的国度。
我说,你就等着瞧吧,等那些尼日利亚的419诈骗者完全掌握了最新的GenAI工具——实时高清视频会议流,搭配GPT-4.5/Claude Sonnet 3.7后端技术。
谁也不会再接陌生来电了。你需要提前约定的一次性密码(一次性密码)在他们联系你时确认他们的真实身份。
OnlyFans将会变成OnlyBots,游戏将不再只是令人上瘾;它还将演变成身临其境的增强现实,数百万人都会毫不犹豫地放弃现实中的平凡生活,换取曾经只能在梦中想象的未来。
在主流媒体大规模传播官方认可的宣传内容,而所谓的“开放”社交媒体平台却被大量的AI生成的账号淹没,真相被合成噪音淹没的情况下,你还信任谁?
我对此并不会感到意外,如果有人利用大规模的人工智能技术来伪造耶稣基督第二次降临的场景或事件,这样的事情。
有一点我可以肯定,Siri 的表现还是不会让人满意。
共同学习,写下你的评论
评论加载中...
作者其他优质文章