澳门尼威斯人网站8311欢迎您|B站的老司机都从这里上车了|上市半月后摩尔线程技
发布时间:2025-12-29 来源:澳门威尼克斯人官网
威尼斯官网★◈✿,澳门威尼克斯人官网网址★◈✿,澳门威尼斯人官网★◈✿,澳门威尼克斯人★◈✿,学术合作澳门威尼斯人官网★◈✿,研讨会★◈✿。12月20日-21日★◈✿,摩尔线程首届MUSA开发者大会(MDC 2025)举办★◈✿,摩尔线程创始人★◈✿、董事长兼CEO张建中一连公布了一系列技术与产品进展★◈✿,其中包括全新架构“花港”★◈✿,基于该架构的“华山”★◈✿、“庐山”芯片★◈✿,智能SoC芯片“长江”★◈✿,以及夸娥万卡智算集群和AI算力本MTT AIBOOK等★◈✿。
”★◈✿,在发布会上★◈✿,张建中也未避讳提到与英伟达的对比★◈✿。以最新发布的“华山”芯片为例★◈✿,张建中表示★◈✿,“华山”的访存带宽★◈✿、浮点算力和高速互联带宽三个指标能力介于英伟达
更低★◈✿,但迁移后仍会存在接口适配★◈✿、功能适应等问题★◈✿,“(生态)还处于爬坡阶段★◈✿。”一位企业开发者提到★◈✿。不过★◈✿,未来随着厂商积极推进适配优化以及生态内的联动加强★◈✿,生态成熟度也将持续提升★◈✿。新架构和新芯片
张建中透露★◈✿,基于该架构★◈✿,摩尔线程公布两款芯片技术路线★◈✿。一款是“华山”澳门尼威斯人网站8311欢迎您★◈✿,专注AI训推一体与超大规模智能计算★◈✿,集成新一代异步编程与全精度张量计算单元★◈✿,支持从FP4至FP64的全精度计算★◈✿;另一款是“庐山”★◈✿,专攻高性能图形渲染★◈✿,AI计算性能提升64倍★◈✿,几何处理性能提升16倍★◈✿,光线倍★◈✿,并在纹理填充★◈✿、原子访存能力及显存容量方面有所增强★◈✿。
此外★◈✿,大会发布了夸娥万卡智算集群B站的老司机都从这里上车了★◈✿,浮点运算能力达到10Exa-Flops★◈✿,训练算力利用率(MFU)在Dense大模型上达60%澳门尼威斯人网站8311欢迎您★◈✿,MOE大模型上达40%B站的老司机都从这里上车了★◈✿,有效训练时间占比超过90%★◈✿,训练线%★◈✿,与国际主流生态兼容★◈✿。张建中表示★◈✿,2024年摩尔线程推出第一代千卡集群★◈✿,今年达到1万卡★◈✿,接下来还要做10万卡★◈✿、50万卡★◈✿、100万卡★◈✿。
摩尔线程针对大模型训练的挑战★◈✿,打造出的夸娥万卡智算集群及其配套技术方案澳门尼威斯人网站8311欢迎您★◈✿,可以通过软硬件协同优化保障训练稳定性与精度★◈✿。张建中表示★◈✿,摩尔线程选取 DeepSeek V3★◈✿、DeepSeek R1等主流模型★◈✿,采用FP8精度进行训练复现★◈✿。结果显示★◈✿,其训练loss曲线与Hopper系列显卡基本上一致★◈✿,而从实际测评结果来看B站的老司机都从这里上车了★◈✿,相同数据量★◈✿、相同模型的情况下★◈✿,摩尔线程的训练效果更优于国际主流显卡★◈✿。
除了芯片和智算产品外★◈✿,摩尔线程还发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK★◈✿,提供了50TOPS的端侧AI算力★◈✿,支持包括MT AIOS(Linux)★◈✿、Windows虚拟机★◈✿、Android 容器和国产操作系统等多系统切换B站的老司机都从这里上车了★◈✿,支持开发者在不同环境下开发各种国产应用场景★◈✿。“我们把AI原生的应用场景都内置在这一台AIBOOK中★◈✿,它是一台多系统随意切换的★◈✿,结合开发★◈✿、娱乐★◈✿、办公于一体的(算力本)★◈✿。”张建中表示★◈✿。
摩尔线程展区现场工作人员介绍★◈✿,在传统迁移场景下★◈✿,开发者面临的最大成本是代码迁移成本澳门尼威斯人网站8311欢迎您★◈✿。由于不同硬件体系★◈✿、架构体系对应的编程语法结构与算子库调用方式存在差异★◈✿,迁移过程中需适配新的开发规范★◈✿。为此★◈✿,摩尔线程推出了相应的配套工具★◈✿,可实现代码的自动化迁移★◈✿,无需开发者人工重写代码★◈✿,仅需进行简单的文本调整★◈✿,即可实现近乎零成本的迁移★◈✿。
企业研发人员称★◈✿,初期与摩尔线程适配时★◈✿,也存在生态差别★◈✿、接口不一等不适应的情况★◈✿,不过经由两边的讨论协商★◈✿,这些难点都得到了一一解决★◈✿。“硬件支持上一定是快速做到★◈✿,只有接口适配★◈✿,才能在后续进行其他功能的开发★◈✿。”尚阳科技在两年前开始适配摩尔线程的MUSA生态澳门尼威斯人网站8311欢迎您★◈✿,通过摩尔线程全功能GPU★◈✿,其打造了企业级智能体引擎Useek曜芯智问★◈✿。尚阳科技董事长李向阳向时代财经提到了摩尔线程的GPU全功能的定位★◈✿,其能够实现了图形处理与计算功能等的一体化集成★◈✿,部分性能对标英伟达产品B站的老司机都从这里上车了★◈✿。同时★◈✿,此前多数开发者使用英伟达芯片★◈✿,其调用算力所依赖的框架为CUDA★◈✿,而MUSA框架在对CUDA的兼容性上表现优异★◈✿,这一点与其他平台存在显著差异★◈✿,也是其核心优势所在★◈✿。得益于MUSA框架具备深度兼容特性★◈✿,开发者向该平台迁移项目时★◈✿,操作流程将更为简便★◈✿。李向阳称★◈✿,目前他最关注的是MUSA生态未来在细节功能的适配上的进展★◈✿。
