由深圳市人民政府主办的第二十七届高交会于2025年11月14日-16日在深圳举行。作为高交会的重要论坛“中国高新技术论坛”于11月14日举办,论坛主题为:人工智能赋能未来产业发展”。谈及算力行业的变化,炜烨智算(北京)科技有限公司合伙人邱领表示,它的关键点早就从之前的快速大量建设,变成如何构建一个可以高效、经济、自主、联动的算力供给体系。
在她看来,算力集群应该从一个曾经凝固的固定资产变成可以流动的生产材料。她推荐使用Token结算的方式,将算力封装成它最小的可度量和可受用的单位Token,用户就不再需要对某一台服务器在一定时间内支付高昂费用,可以像结水电费一样按需结算。“目前可以把百万Token降低到几毛钱人民币,国内还是7-10元人民币之间,这中间的价差是利润点和我们的护城河。”

以下为演讲实录:
邱领:尊敬的各位嘉宾、朋友们,大家上午好!我是邱领,来自炜烨智算,非常激动可以代表算力这个行业和炜烨智算的团队再次站在高交会的舞台上。每年这个时候我都能深刻感受到深圳作为创新之都的强劲脉搏。
刚刚在刘院士和胡总做分享时,我做了很多笔记,我的深刻感受是人工智能真的从曾经高高在上的技术变成我们日常生活以及工作中真实的工具。
今天我的分享暂时把大家的关注点从人工智能应用以及数字化技术拉到相对比较底层的算力行业,看看现在的一些问题和我们的解决方案。
炜烨智算团队已经在算力行业深耕四年,我们几乎是与这个行业同周期生长的,我们曾经建设过超大集群,并且运营运维进行过商业化的变现,我们曾经经历过这个行业的高峰期、高光时刻,同时也经历了这个行业的很多问题。三年前大家最常问我的是我们有没有算力,算力在哪里?但今年问我的问题是,我们的算力是不是已经过剩了。这个行业现在的问题远不止有或无、多或少这么简单,比如对于外卡高GPU的依赖非常严重,同时国产算力中呈现出的生态割裂没有办法形成合力的问题也日益棘手。最为严重的是这个行业的商业模式现在还停留在非常简单的靠杠杆建设,希望一次性兜底包圆的方式,这些问题都让我们行业变得越来越固化,没有办法支持上层人工智能快速发展,甚至造成很多资产、资源以及经济上的浪费。当我们意识到这个问题时,我们也快速发现对于算力行业的变化,它的关键点早就从之前的快速大量建设变成今天我们称它为如何构建一个可以高效、经济、自主、联动的算力供给体系。
今天我和大家分享一下我们在AIDC建设中的一些实践和思考。
之前当我们谈论到算力时,大家往往关注点都在某一个型号或者某一个品牌上,但今天当我们面对动辄万亿参数的多模态模型时,任何一张卡或者任何一个型号,都没有办法单独满足一个智算中心训练或者推理的需求。换句话说,我们认为将来的智算中心一定是多元共建生态,它一定会有高精尖的外卡做专门的训练,同时还有各类国产卡组成的不同服务器类型和超节点做一些场景化、针对性的特定训练,比如像视频解码、推理任务等等。
关键一方面是我们要持续找到对于各种硬件最适合的场景,同时我们也要在集群的调度过程中让这个任务和硬件工作可以完全匹配。为此,我们在自己的系统平台上做了一些开发,比如智能任务调动功能。当一个任务刚刚进来时,我们会让系统对它做一个判断。比如现在一个预训练的任务进来,我们首先会让外卡先做最核心的训练灌注,当它达到一定程度时,我们会把这个任务放在国产卡集群上,让它进行后续被分解的推理。这样可以大量减少训练时长和成本。
再比如,现在有一个视频生成任务进来,我们会把它放在最适合视频解码的功能区。比如我们的合作方希望他的S1卡进行解码,之后再放到其他卡进行后续任务。这个方案我们也在尝试落地到类似一体机的方案中,我们起的名字叫“猎户座”,更像某些特定算力系统,在它最适合的岗位上做高效的工作。
同时我们在通讯层和指令级层做了探索,甚至我们用什么样的光模块、交换机,会决定这个智算中心的通信效率和算力产出效率。我们在多元共建的技术和产品方面也做了很多的尝试。
接下来分享一下在商业层面我们的一些思考。我相信在座各位一定会在今年某一时刻听到过,也有可能您在自己的朋友圈看到某一位创业者或者创业团队他们急需某一个卡的集群,希望在一两个月内能立刻用上。到底是什么造成一边闲置一边又资源紧张的状况?我们认为它跟非常传统的地产模式息息相关。大家早期用了非常高的杠杆进行大规模的建设,希望能找到一个一次性包圆或者兜底的使用方,一次性完成资金的回流。但在需求侧,AI公司对于算力的需求一定是波动和弹性的,比如今天他可能需要一个大的训练集群,明天就会在全国各地需要很多零散的推理集群,今天需要视频解码的卡,明天需要的是逻辑推理的卡。市场中对于算力的需求永远是流动和变化的。
这给我们一个启发,我们可以借助金融的思想。我们认为算力集群应该从一个曾经凝固的固定资产变成可以流动的生产材料。
首先,我们非常推荐使用Token结算的方式,将算力封装成它最小的可度量和可受用的单位Token,用户就不再需要对某一台服务器在一定时间内支付高昂费用,可以像结水电费一样按需结算。对于业主方,看似没有了之前想要的一次性现金回流,但可以把集群中的闲置算力在价格最高峰时出售,这对于业主的回报率是整节点出售的3倍以上。
接受这种算力结算方式,需要很多对上层应用发展的信心,同时也需要一个很强大的软件和应用平台。我们很开心看到像现在的云大厂(阿里、字节、火山等)包括人工智能领先的公司商汤科技、无问芯穹等创业公司都在算力方面不断发力,目前我们可以把百万Token降低到几毛钱人民币,国内还是7-10元人民币之间,这中间的价差是利润点和我们的护城河。
我们首创了算力银行模式,接受算力储蓄和算力贷款。如果现在没有客户,不知道怎么运营,我们非常欢迎大家交由我们处理,由炜烨自研的云管平台统一纳管和销售,今年我们接受了一家客户,曾经不到30%的使用效率提升了一倍,业主方依然保留了资产的处置权,这段时间有一个固定的年化收益。这是我们将不良资产变成一个生息资产的华丽尝试。
算力信贷层面,我们非常愿意向初创团队特别是做AIAgent的团队在研发时间内以非常低昂的算力研发费用支持它的研发。比如今年夏天有一个AIAgent团队用三个月希望做一个产品研发,我们给它的算力打折到1/3,并不是我不收上面2/3的钱,而是可以后付。作为交换,我要求它为我一个文旅公司做AIAgent的落地。炜烨作为中介方,有技术服务收入,在Agent落地后,不管是文旅公司还是AIAgent的创业企业,都成为我推理算力的客户,一举三得。
最后分享一下我们对于生态的理解。
今年不管是在海外还是国内,大家都看到很多巨头在携手共进,比如英伟达、Open AI、微软甚至Oracle,我们认为生态就是互不打扰但又互相依赖的共生。我们非常相信不管是算力行业还是人工智能行业,就是算力共建的过程。我们把自己的角色从曾经的资产建设和资产销售者变成今天的算力共建者,我们也认为我们的使命应该把算力的权力更多和更普遍的交给使用它的开发人员。回到最开始提多现在的算力行业需求是要一个高效、经济、自主和联动的供给体系,我们认为它一方面是需要有技术上的支持,另一方面也需要大家对于商业模式上有一个全新的认识,特别是需要从原来购买资产变化到购买服务,从原来看重所有权变到现在追求使用权。这个过程中肯定大家会遇到各种各样的问题,但我们也相信长期主义和深耕还是会有最终回报的,我们也相信这个螺旋上升的道路和最终光明发展的前景。
以上是我今天的分享内容,感谢大家!
新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

