界面新闻记者 |
界面新闻编辑 | 文姝琪
12月20日至21日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京开幕。这是其上市后的首次公开亮相。摩尔线程创始人、董事长兼CEO张建中把从架构到集群的全栈技术等“全家桶”摆到台前,集中发布了一系列以自主MUSA统一架构为核心的全栈技术成果。
其中,最受关注的是摩尔线程新一代全功能GPU架构“花港”。界面新闻记者了解到,花港支持FP4到FP64的全精度计算,算力密度提升50%,效能提升10倍,可支持十万卡以上规模的智算集群。
在张建中给出的路线图里,花港被定义为下一代全功能GPU架构的底座。未来,摩尔线程将推出两款基于该架构的GPU芯片,包括高性能AI训推一体的“华山”芯片和专攻高性能图形渲染的“庐山”芯片。
同步发布的还有夸娥万卡智算集群(KUAE2.0)。张建中披露了其在万卡规模下的关键效率指标,包括训练算力利用率MFU在Dense大模型上达60%、在MoE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达到95%。
在推理侧,摩尔线程联合硅基流动,基于MTT S5000运行DeepSeek R1 671B全量模型,单卡Prefill吞吐突破4000 tokens每秒、Decode吞吐突破1000 tokens每秒。

此外,张建中还发布了面向下一代超大规模智算中心的MTT C256超节点架构规划,并提及在具身智能、科学智能(AI4S)、AI for 6G等领域的深度布局计划。
更贴近开发者日常的变化,来自一台算力笔记本。
摩尔线程这次还发布了一款面向开发者的AI算力笔记本MTT AIBOOK。该笔记本搭载摩尔线程自主研发的智能SoC芯片“长江”,提供50 TOPS异构AI算力,支持混合精度计算,运行基于Linux内核的MT AIOS操作系统,具备多系统兼容能力,预置完整AI开发环境与工具链。
界面新闻记者了解到,目前,这款笔记本已在京东开放预售,32GB、1TB的版本预售价为9999元。
一名摩尔线程研发人员向界面新闻记者表示,这款面向AI开发者的算力本,同时也是把端侧产品化跑通的全链路验证。
“如果新芯片出来,连自家都没有从头到尾验证一遍,合作伙伴往往也会谨慎使用,我们用AIBOOK把硬件、驱动、软件栈、工具链与系统打包到一台设备里,让合作伙伴看到‘证明是可以用的’,导入节奏也会更稳。”研发人员向界面新闻记者表示。
对摩尔线程这类的GPU厂商而言,开发者与个人市场的入口,往往也是更容易推进生态扩张的一条路。
硬件之外,软件栈与开发者习惯往往决定生态扩张速度。
英伟达将CUDA定义为并行计算平台与编程模型,围绕它形成了长期积累的工具链和开发者社区。公开信息显示,截至去年6月,全球CUDA开发者规模约为500万人。英伟达官网信息显示,CUDA累计下载量已超过5300万次。
与之对标,MUSA覆盖从芯片架构、指令集、编程模型到运行库与驱动框架的全栈体系,本次升级到5.0版本。
张建中给出了更具体指标,muDNN的GEMM与FlashAttention效率超过98%,通信效率达到97%,编译器性能提升3倍,并计划逐步开源计算加速库、通信库与系统管理框架等组件。
“生态体系是GPU行业的核心护城河与价值所在,依托MUSA架构的优势,我们会持续加大研发投入,攻克从硬件到软件的核心技术挑战,深化与生态伙伴的协同,共同构建自立自强的国产计算产业生态。”张建中说。
实际上,摩尔线程这条全栈路线本质上是用软件生态去放大硬件竞争力。
TrendForce在2025年10月的分析中预计,全球AI服务器出货量在2026年仍将保持两位数增速,供给与生态继续向头部集中。IDC的相关信息也显示,2025年上半年中国加速服务器市场规模约160亿美元,并保持增长态势。
随着推理负载占比上升,算子、通信与编译器的工程化能力开始与芯片峰值参数同等重要,这也是厂商把软件栈与集群工程放到同一张路线图上的原因。
在需求上行与供给约束并存的环境下,国产GPU公司更需要用可持续的软件栈、规模化交付与工程能力进入主流产业链。
此外,张建中还披露了目前摩尔学院的发展进度,截至今年12月,其AI开发者社区与学习者规模接近20万人,覆盖200多所高校,并吸引超过10万名学子参与,“我们希望聚集所有的能力能够共同去打造国产GPU的生态。”
多位摩尔线程的合作伙伴在接受界面新闻记者采访时都提到,接入生态的第一关仍是适配与工程细节。
一位合作伙伴向界面新闻记者表示,张建中在台上谈差距“很坦诚”,现实里大家最直接的体感是,与国际主流产品相比,国内在性能与生态上大约还差“1到2代”。
其向界面新闻记者表示,实际的推理场景未必需要追到最顶配的配置,现阶段“够用”和“划算”这两点对不少客户更重要。
另一位合作伙伴则在接受界面新闻记者采访时表示,CUDA生态“几十万人用了很多年”,迁移到MUSA时,业务方最希望的是工具链更顺、适配覆盖更广,但这类工作极其消耗人力,需要厂商持续投入。
无论是合作伙伴的现场反馈,还是张建中的公开表述,大家并不避讳公开谈现实问题——与国际主流产品相比,国内在性能、生态与工程积累上仍存在差距。
张建中表示,希望利用全功能GPU建立这样的基础设施,“为各行业的科研工作者和科技开发者,让他们有条件做得更好。”
对摩尔线程而言,上市只是走到了国产GPU赛道的前列。接下来,如何把技术路线图转化为交付能力,并在生态构建上直面国际巨头与国内日趋激烈的市场竞争,依然是一场硬仗。

