银河麒麟智算操作系统应势而生,作为自主创新的智能计算底座,它以“异构混训、安全创新、性能高效、生态统一”为核心理念,突破技术藩篱,重构算力价值,旨在为各行业提供强大、灵活、安全、创新、可靠的智能计算解决方案,为数字经济时代打造全新“智算引擎”!
银河麒麟智算操作系统是专为AI时代设计的操作系统,覆盖“芯片适配-算力调度-开发支持-场景落地”全链条,打造智能驱动数字化标杆产品。
基于“全栈式技术架构”的核心定位,系统构建了“三位一体”端到端能力体系:系统层提供AI增强的银河麒麟高级服务器操作系统,实现芯片级异构算力适配与智能调度;框架层提供统一训练/推理框架与高效算子库,打通开发支持关键路径;资源管理层通过云化智能调度平台,实现跨地域异构算力的动态优化配置。这一架构贯通了从硅片到场景的全栈价值链路,既保证了底层算力的高效供给,又降低了中层AI工程化门槛,还完成上层AI应用的敏捷创新支撑,形成从基础算力到场景价值的完整转化闭环。
容器启动加速
容器冷启动速度提升30%以上。
GPU拓扑感知优化的批量调度
实现了GPU拓扑感知调度,支持多机多卡拓扑感知调度;麒麟AI作业调度器与主流开源相比,训练任务完成时间缩短约30%,提升大规模训练时任务的运行效率。
NUMA感知调度
实现了集群级的NUMA感知调度,支持NUMA结构下的访存优化组合计算和自动亲和性绑定;与kubelet原生NUMA分配算法相比,分配耗时缩短一倍,提升大规模训练时任务的运行效率。
算子分析与优化
兼容主流框架算子,面向国产CPU实现自适应并行化和自动向量化CPU算子优化,算子性能整体提升3倍以上;实现100+典型GPU算子优化。
多GPU训练框架兼容
同源支持多GPU的统一训练框架,消除各类AI加速芯片软件栈间的差异。
国产“CPU+GPU”推理框架优化
综合拓扑感知资源调度、基于图优化的算子融合、运行时通信优化、运行时内存优化、GPU算子优化、CPU算子优化、同步域感知的内核线程调度优化等技术进行推理框架优化。
异构加速卡统一通信库
支持异构GPU间混合GDR,支持Allreduce、Allgather、All2all等典型集合通信,支持多节点异构多卡的DDP并行训练。
• 智慧金融——基于银河麒麟智算操作系统的金融大模型推理优化
方案架构:适配支持FT5000C+某国产GPU 64卡集群;
应用价值:适配支持金融大模型及基于金融大模型的风控等金融场景推理服务;数据访问延迟降低40%-60%,计算性能大幅提升,推理性能最高提升达9.67倍。
• 智慧党建——基于银河麒麟智算操作系统的智慧审校模型适配优化
方案架构:基于FT5000C+某国产GPU 4卡AI服务器;
当前,计算产业面临着以人工智能为驱动力的新变革。麒麟软件将顺应变革趋势,持续投入AI相关技术研发,聚焦产业与市场发展需要,满足算力需求,与生态伙伴加强协同,赋能千行百业数智化转型。
通讯员 | 刘韵
来 源 | 麒麟软件研究院