炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

亚马逊云科技CEO马特加曼在re:Invent2025谈如何真正让Agent工作亚马逊云科技CEO马特加曼在re:Invent2025谈如何真正让Agent工作

  追逐短期泡沫带来的眼前利益不可取。在一些云厂商思考如何提前把算力卖出去的时候,亚马逊云科技把重心放在让算力真正用起来,让Agent真正跑起来

  在全球云计算市场,坐在头把交椅上的亚马逊云科技正面临着一场白热化的竞争。

  微软通过投资OpenAI,拿到了OpenAI这几年在微软Azure数百亿美元的云支出。微软Azure与亚马逊云科技的收入差距因此缩小。谷歌云GCP、甲骨文OCI、CoreWeave这些“挑战者”则是通过算力、资本合作的策略,提前锁定了少数几家大客户未来3年-7年的合约。

  亚马逊云科技依旧在全球云市场稳居第一,市场份额37.5%(Gartner 2025年数据),比第二名高12个百分点。截至2025年12月,亚马逊云科技年度经常性收入(ARR,约等于年收入。云与软件公司以年/月订阅收入为主,收入确定性强)1320亿美元,同比增长20%。它在2025年三季度营收增速也来到近三年(2022年四季度-2025年三季度)的高点。

  但它同样面临一场巨大的变局。竞争对手不只是抢企业客户、市场份额这么简单——它们正在试图争夺未来的主导权。

  一个中期挑战是,微软Azure、谷歌云GCP、甲骨文OCI、CoreWeave用投资或算力合作的方式,提前换取了少数几家大客户未来3年-7年的合约。一些企业的剩余履约义务(RPO,即已签约但尚未确认收入的合同金额,可以简单成积压订单)短期内暴增。这种“算力金融化”的竞争手段,给亚马逊带来股价和舆论的短期压力

  此时,云计算的全栈AI(包括芯片、模型等)的整合能力变得更重要。自研芯片,可以降低Token(词元,一个Token可以是单词、标点、数字、符号等)的算力成本。自研模型,可以成为吸引企业客户的重要工具。近一个月,谷歌的自研芯片TPU v7和自研模型Gemini 3就展现了全栈AI对客户的吸引力。

  接下来的一个重要趋势是,Agentic AI(代理式 AI)正在成为新的战场。未来会有数十亿个Agent(智能体)诞生。如果无法提供完整的Agent开发工具,就无法留住企业客户。

  面对这些变化,亚马逊云科技要如何应对?美国西部时间12月2日,亚马逊云科技在一年一度的战略和技术大会re:Invent2025上发布了一系列新的产品和服务——它的主线是帮助企业客户快速落地Agent(智能体)。

  亚马逊云科技CEO(首席执行官)马特加曼Matt Garman)在主题演讲中提到:AI Agent正在把我们带到AI发展的关键拐点……未来每家公司每一个可以想象的领域中都会运行数十亿个Agent。

  马特加曼认为,真正带来价值的Agent,需要四大核心组件——AI基础设施(云、芯片、模型等)、AI推理平台、数据、Agent开发工具。

  过去十多年,亚马逊云科技引以为傲的是低成本、高效率的基础设施。一个新的趋势是:在未来Agentic AI的时代,它们都将为Agent服务。Agent将不仅只是助理,而是下一代应用的基本单元。云计算所有基础产品,如计算、存储、网络、数据、安全等,最终都是为了支撑数十亿个Agent在云724小时运行。

  云计算,曾经是三层架构——IaaS(基础设施)、PaaS(平台软件)、SaaS(应用软件)。但在Agentic AI的未来,“Agent+Token”将是应用和算力的主要形式。

  让Agent算力成本更低,要怎么做?

  Agent每一次运行,都要消耗Token。Agent的Token消耗量,甚至是简单的AI对话的十倍以上。那么,要如何降低Token成本,为企业客户提供更有性价比的算力基础设施?

  亚马逊云科技采取了自研AI芯片的策略(详见《替代英伟达,亚马逊云科技已部署超过100万枚自研AI芯片》)这可以替代一部分英伟达的芯片。

  云厂商自研芯片,可以降低算力基础设施的TCO(总拥有成本)。

  逻辑是,云厂商采购英伟达GPU(图形处理器)并租给客户,其中有一部分芯片的溢价支付给了英伟达。英伟达2025年毛利率高达69%,这远高于芯片行业平均水平。

  如果自研芯片,原本支付给英伟达的溢价转化为自身毛利空间。因为,自研芯片一旦量产,边际成本会逐渐降低,甚至逐渐趋近台积电的代工成本。理想情况下,甚至只需要三分之一的价格就能得到和英伟达性能接近的芯片。

  亚马逊云科技自研的AI芯片Trainium 3已经上线,这是一款3nm(纳米)工艺制程的芯片。re:Invent2025上披露的信息显示,Trainium 3每兆瓦电力能产生的Token数量是上一代芯片的五倍。Trainium 3与其他产品相比,训练成本最多可降低50%。

  Trainium 3被搭载在Trn3 UltraServer服务器上。这个服务器集成了144枚芯片,总算力高达362PFlops(每秒浮点运算次数)。它的整机性能甚至超过了英伟达目前在售的旗舰AI服务器Blackwell GB200 NVL72。

  按单卡性能计算,Trainium 3看似只有英伟达GB200的56%。但实际上,英伟达GB200是两枚B200硅片封装成一枚芯片的。从单硅片设计水平来看,Trainium 3并落后

  Trainium 3的优势在于——它有更先进的工艺制程,这可以降低能耗成本。它还有更大的带宽,可以提升Token的吞吐效率。在单卡性能不够高的情况下,亚马逊云科技通过提升服务器整机算力、带宽的方式缩小了和英伟达的差距。

  亚马逊云科技下一代AI芯片Trainium 4正在研发设计阶段。按照规划,Trainium 4在FP4(一种数据精度,比FP8、FP16更节省算力)下的性能相比Trainium 3将提升6倍以上。

  我们了解到,亚马逊云科技目前已经部署了超过100万枚Trainium系列AI芯片。Trainium芯片每年可以为亚马逊云科技带来数十亿美元的收入。

  为容纳更多AI芯片,亚马逊云科技还在不断扩充产能——过去12个月新增了3.8GW(GW,即吉瓦是功率单位。1GW算力集群可容纳20万枚英伟达GB200芯片)算力。亚马逊云科技目前的算力容量是2022年的两倍,2027年还将再次翻倍。

  目前,并没有相关报告分析Trainium 3的运行成本,但有其他云厂商的案例可以参考。Trainium 3如果产能够大,边际成本够低,它也可以帮助亚马逊云科技实现类似效果。

  今年11月28日,全球半导体研究机构SemiAnalysis在一份有关谷歌TPU v7(张量处理单元,即谷歌自研的AI芯片)芯片的成本分析报告中详细计算了TPU v7的运行成本。

  谷歌内部使用的TPU v7运行成本为1.28美元/小时,只有英伟达GB200(英伟达在售的旗舰芯片)2.28美元/小时的56%。谷歌在云上对外服务客户时需要加上利润空间,届时TPU v7的运行成本仅为1.6美元/小时,依旧只有英伟达GB200的51%。

  芯片有性价比还不够,全栈AI的另一个重要组成部分是——自研模

  有了自研模型,才能进一步榨干芯片性能,降低推理成本。亚马逊云科技此次发布了Amazon Nova 2系列的自研模型,其中包括Lite(轻量化版)、Pro(专业版)、Sonic(声音模型)、Omni(多模态推理模型)这四个版本。目前Amazon Nova系列已有数万企业客户,包括海信、印孚瑟斯(印度第二大IT企业)等国际化企业。

  国际市场调研机构ArtificiaAnalysis 截至124日数据显示,Amazon Nova 2 Pro的性能位居全球第10,和谷歌Gemini 3 Pro、Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1,以及中国的DeepSeek V3.2等模型存在差距。但它的优势是,可以用较少的Token得到更准确的效果。它的推理成本也低于上述旗舰模型。

  Amazon Nova系列模型的定位是,让亚马逊云科技生态内的客户能够低成本处理那些难度更低的任务(如简单推理、多模态生成

  一位亚马逊云科技人士曾对我们表示,Nova系列的主打卖点是,便宜、好用、安全,量大管饱,以及多模态。企业内的常见做法,复杂的任务和推理交给旗舰模型,简单的任务交给Nova系列。Nova可以帮助企业客户节省算力成本。

  不同于其他云厂商通常只是主推自研模型,亚马逊云科技采取了更灵活的竞争策略。它在提供自研模型的同时,还提供了选择权。

  亚马逊云科技的Amazon Bedrock模型平台上,集成了亚马逊、谷歌、英伟达、OpenAI、DeepSeek阿里千问、KimiMiniMax等17家模型厂商的数十款模型。因为现在,企业往往不只使用一款模型,而是使用多款模型。

  一位亚马逊云科技计算业务负责人12月3日在一场小规模沟通中对我们表示,跑同一个开源模型,企业选择亚马逊云科技,甚至比原厂有更低的推理成本。因为Amazon Bedrock有更高效的调度能力尤其在企业普遍使用多模型的背景下Bedrock能够通过统一的容量池技术,对模进行毫秒级动态加载与卸载这种机制提升了底层算力的利用率,避免了为每个模型预留闲置算力所造成的浪费。

  亚马逊云科技靠++模型”的全栈AI,形成了自己的竞争壁垒——虽然单卡性能不是最强,单一模型排名不是最高,但它可以在多个环节帮助企业降低算力成本。

  让Agent更容易落地

  为了帮助企业客户落地AI应用,过去两年亚马逊云科技一步一步,接连推出了Amazon Bedrock平台和众多模型,迭代Amazon SageMaker(数据分析和AI的一站式平台)等服务与工具。

  它们逐步解决了企业选择模型、治理数据、开发应用等问题。这吸引了一大批企业客户使用亚马逊云科技,Amazon Bedrock甚至正在成为亚马逊云科技的下一个增长点。

  亚马逊管理层在2025年三季度财报电话会议提到,公司正在将Amazon Bedrock打造成全球最大的推理引擎。亚马逊管理层预测称,从长远看,Amazon Bedrock对亚马逊云科技的收入贡献规模将与EC2不相上下。

  我们了解到,Amazon Bedrock目前年营收约为数十亿美元。EC2是亚马逊云科技目前最核心的产品(亚马逊云科技核心产品包括EC2计算、S3存储、RDS/Aurora数据库等),年营收高达数百亿美元,是亚马逊云科技的收入基石。按照亚马逊管理层这一预测,Amazon Bedrock有朝一日也将成为一个数百亿美元的业务。

  马特加曼re:Invent2025披露了两组数据,Amazon Bedrock服务超过10万企业,相较2024年同期企业用户数量增长超过两倍。处理Tokens数量超过1万亿的客户超过50家。这个数据表明,AI正在从POC(可行性验证)测试走向规模化生产。AI已经不仅是尝鲜,而是成为这些企业高频运转的核心业务流。

  企业使用模型的最终目的还是要开发、部署Agent。因为Agent是应用,它才能对具体的业务产生帮助。吸引企业客户真正留在亚马逊云科技上,又需要提供Agent开发工具。

  于是,亚马逊云科技今年7月进一步推出了Agent基础设施——Amazon Bedrock AgentCore这是一套标准化的Agent开发、部署、运行工具

  AgentCore上,企业无需从零编写复杂的代码,就能快速开发出好用、安全的Agent。马特加曼在演讲中提到AgentCore发布后几个月,SDK软件开发工具包下载量已超过200万次

  Adobe CEO

  沙塔努纳拉扬re:Invent2025分享Adobe如何使用Agent)

  全球知名的多媒体创作和创意软件公司Adobe CEO沙塔努纳拉扬SHANTANU NARAYEN)在re:Invent2025分享了Adobe是如何利用AgentCore改变工作流的。

  Adobe正在利用Agent打破旗下产品矩阵(如 PhotoshopAcrobatExperience Platform)间的孤岛。Agent可以理解用户意图(例如“为即将到来的假日促销创建广告活动”),然后自主调用不同的工具和数据完成任务,无需用户手动在不同软件间切换。

  AgentCore在其中起到的作用主要是两方面。一是评估质量,利用AgentCore持续监控评估Agent的表现这对于服务全球大型企业客户至关重要

  二是安全治理AgentCore会有严格的安全护栏例如生成的图像符合版权规定,发布广告前必须经过特定验证步骤。这应对了企业不敢让AI自主行动”的顾虑。

  因此,除了卖Agent开发工具,亚马逊云科技亲自下场,推出了一系列官方Agent工具——其中包括能自动修复漏洞的Security Agent,能自动运维开发的DevOps Agent,以及集成了Agent能力的开发工具KIRO

  这几款产品也已在亚马逊云科技内部业务中被高频使用。“吃自己的狗粮”,这是亚马逊云科技企业文化的一部分——新产品需要内部真正使用过才能卖给企业客户。

  亚马逊云科技CEO马特加曼re:Invent2025介绍KIRO

  尤其是KIRO,这款工具在亚马逊云科技内部已经被验证,它能够大幅提升产能。

  KIRO的logo是个小幽灵,这款产品不同于亚马逊云科技过去IaaS产品(如EC2S3)都是冰冷的资源,logo通常是抽象的立方体、方块或线条。亚马逊云科技Agentic AI时代试图变得更有人情味、更懂开发者

  一位亚马逊的工程师他的团队在过去一年进行了某个代码重构项目。他们原本预估项目需要大约30名开发者,持续18个月。但全面使用KIRO后,团队6名成员76天完成任务

  这个团队经过了几个阶段。最初是学会正确与Kiro的Agent进行交互他们会把任务拆成小块,逐个交给Agent,以确保结果稳定。后来的转折点是,他们不再看护每个小任务,根据更宏观的目标指挥Agent。后来他们让更多Agent并行处理更多工作,甚至让Agent在团队下班后继续消化积压任务。项目开发效率在这个过程中逐步提升。

  这表明,Agent已经不再是实验室的玩具,而是能够接管核心业务流程。

  一位亚马逊云科技一线销售人士对我们表示,亚马逊云科技的Agent基础设施目前相对完整。它的落地能力,目前是相对其他云厂商的核心竞争力。

  从财务分析模型来看,Agent带来的收入增长比单纯的卖算力(如通过API接口销售Token)更具爆发力——它会形成算力消耗的乘数效应。

  用户和Agent每一次交互,都会触发数十次模型推理和数据查询,这带来的Token消耗将是指数级的提升。这也是为什么亚马逊云科技管理层判断,Amazon Bedrock将成为下一个重要增长点。

  我们了解到的一种观点是,随着未来Agent 应用的大爆发,AgentCore甚至有可能独立接过Amazon Bedrock的接力棒,成为亚马逊云科技下一代的核心支柱产品。

  用好AI,比卖算力更重要

  近一年,亚马逊云科技面临的质疑并不少。因为市场对它有更高的期待。

  它被认为缺少足够惊艳的产品。这给人的印象是,亚马逊云科技在新一轮竞争中不够激进(详见《微软、OpenAI同盟生变,亚马逊、Anthropic如何反击》)

  比如,亚马逊云科技自研的Amazon Nova系列模型的性能,和第一梯队存在差距。亚马逊云科技自研的AI芯片Trainium 3性能,和英伟达的GB200、谷歌的TPU v7也存在差距。

  从目前各家财报上公开披露的剩余履约义务数据来看,亚马逊云科技锁定的长约大单,金额似乎也比微软Azure、甲骨文OCI更少。

  与此同时,2025年美国云厂商之间的竞争已经白热化。一位亚马逊云科技一线销售对我们表示,过去从未有过这么多百亿美元、千亿美元大单提前3年-7年就被锁定的情况。

  仔细拆解会发现,目前某几家云厂商签署的长约大单,几乎都是和OpenAI、Anthropic等大模型创业公司签署的训练算力合同。但训练大模型的投入是阶段性的,且边际效应递减。未来,训练算力的占比会逐渐降至10%以下。Agent带来的推理算力收入,才是细水长流且逐渐增长的。它的最终占比将达到90%以上。

  此外,一些美国云厂商签署的长约大单存在难以落地的风险。这直接导致,美国算力市场正在出现算力泡沫的讨论。尤其是甲骨文OCI、CoreWeave,他们的做法是通过用签署未来合同的方式拉动现在的股价。这是一种算力金融杠杆的策略。

  它存在的风险是,如果客户未来无法产生足够的现金流,即使它们提前签署的合同,也将无力支付尾款,这会导致云厂商纸面上激增的剩余履约义务无法真正落地事实上,由于算力泡沫的担忧,某些美国云厂商近几个月已经历了股价“过山车”。

  我们了解到,亚马逊云科技大量已经签订的3年-7年长约,并未完全体现在财报的剩余履约义务中。它没有参与这种算力金融的增长游戏导致这个关键指标显得不够高

  国际AI和半导体咨询机构SemiAnalysis今年9月3日在一份讨论亚马逊AI战略的报告中也指出。2024年-2025年前两个季度,亚马逊云科技营收增速看起来不够快,并不是因为AI产品做得不够好,核心原因是AI芯片产能不足,无法满足客户旺盛需求。SemiAnalysis判断,等2025年末多个1GW算力集群建成后,它的营收增速将逐步提升至20%以上。

  亚马逊云科技并没有追逐短期泡沫带来的眼前利益。在一些云厂商思考如何把算力提前卖出去的时候,亚马逊云科技在思考,如何把算力真正用起来,让Agent真正跑起来。

  这和亚马逊云科技的技术文化有很大关系——它追求实用主义产品策略,而非单纯的技术竞赛。在这家公司的“技术-工程-产品”的开发流程中,客户当下痛点被放到了更高的位置。因此,亚马逊云科技内部一种声音是,不解决年后的科幻问题”,只解决“当下80%客户都面临的真实痛点”。

  把客户痛点进行工程化产品化,并转化成变成标准服务这种方式虽然稳健,但往往缺乏“黑科技”的惊喜感。这也无法完全满足资本市场快节奏预期

  亚马逊云科技更愿意谈论降本增效、现代化迁移、如何使用Agent,这些CIO(首席信息官)、CTO(首席技术官)真正关心但听起来枯燥的话题。

  一个细节是,美国云计算厂商正在机场广告中争夺“谁是第一”的话语权(详见《美国云厂商也在机场卷“谁是AI云第一”》)。谷歌云的广告内容是“The best of Google AI”(最好的谷歌AI)。CoreWeave的广告内容是,“The world‘s best AI?”(世界上最好的AI是谁?);“Yeah, it runs on CoreWeave”(没错,它现在跑在CoreWeave上)。

  但亚马逊云科技采取了朴实无华的广告策略。它和企业客户、合作伙伴联合营销,推出六个客户使用亚马逊云科技降本增效的广告案例。一位亚马逊云科技人士对我们表示,亚马逊云科技希望给企业的CIO、CTO带来更强的确定性,它更追求真实的交付。

  事实上,这也是现在企业智能化转型过程中真正被关心的问题。亚马逊云科技的企业客户更多是苹果、辉瑞、索尼、宝马、丰田、纳斯达克巨头,以及Salesforce、Adobe、Datadog、databricks、Snowflake等软件巨头。

  这些公司思考的是,每一分钱的IT支出要花在刀刃上,取得实际转化效果。从长期来看,这些客户的支付能力远比依赖融资的AI独角兽要稳健。它们承诺的IT支出,最终会真正落入能真实解决问题的云厂商手中。

  面对美国市场的AI泡沫的质疑,亚马逊云科技作为老牌云计算巨头,它有更强的战略定力。它的策略或许短期内在资本市场不够性感,但在智能化转型漫长且枯燥的技术长跑中,这会更符合企业客户的需求。

  历史无数次证明,依靠金融杠杆撬动的繁荣往往是短暂的。当潮水退去,真正的赢家,往往是拥有铲子,还能客户用铲子挖出金矿的企业。

 新浪声明:此消息系转载自新浪合作媒体,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。