| 摩尔线程于2025年12月20日首届MUSA开发者大会正式发布新一代全功能GPU架构 “花港”,定位覆盖 AI 训推、图形渲染、科学计算的全场景,基于 MUSA 统一体系打造,算力密度提升 50%、能效提升最高 10 倍,支持十万卡级集群扩展,是国产 GPU 在全栈自研与高端场景的重要突破。 核心技术与性能 计算与精度 新一代指令集 + 异步编程模型,算力密度 + 50%、能效 + 10 倍,支撑大规模并行计算。 全精度覆盖 FP4–FP64,新增 MTFP6/MTFP4 混合低精度,适配 AI 大模型与科学计算端到端加速。 4 层安全架构,支持国密算法与机密计算,累计 514 项授权专利,保障数据安全。 互联与集群 自研 MTLink 高速互联技术,支持十万卡以上智算集群,服务万亿参数模型训练与国民级推理需求。 新一代异步任务调度与并行机制,优化线程同步,提升集群效率与扩展性。 图形与 AI 融合 第一代 AI 生成式渲染架构(AGR)+ 第二代光线追踪硬件加速引擎,完整支持 DirectX 12 Ultimate。 图形端性能跃迁:“庐山” 芯片 AI 计算 + 64 倍、几何处理 + 16 倍、光线追踪 + 50 倍,适配工业设计 / 游戏 / 内容创作。 产品路线与生态 双芯片规划(预计 2026 年量产) 芯片系列 核心定位 典型场景 华山 AI 训推一体 大模型训练、推理部署、智算集群 庐山 高性能图形渲染 工业 CAD、影视渲染、高端游戏 生态与软件栈 MUSA 软件栈全面升级,开放工具链与 SDK,适配主流框架(PyTorch/TensorFlow/CUDA 迁移)。 配套 “夸娥” 万卡智算集群方案,支撑万亿参数模型训练,降低大规模部署门槛。 定位与意义 从单一加速卡向 “全功能 GPU 平台” 升级,补齐国产 GPU 在 AI 与图形双场景的高端能力缺口。 以架构创新 + 生态协同,对标国际主流 GPU,助力 AI 与图形领域的国产化替代与自主可控。 |