北京智源人工智能研究院(BAAI)近期宣布,携手生态合作伙伴共同开发并开源了异构统一通信库FlagCX。该库旨在解决多元算力时代通信库所面临的挑战,并填补多元算力开源软件栈的关键空白。此举积极响应了国家相关机构发起的“清朗·网络平台算法典型问题治理”行动,彰显了算法的导向性、公平性、公正性和透明度。

在多元算力时代,通信库作为算力大规模集成的基础软件,面临两大难题:一是通信库多样化,导致通信算法的通用性和自适应性不足;二是难以实现不同芯片之间的高效互联。FlagCX的推出旨在实现不同芯片间的有效通信以及在不同场景下的大规模自适应通信优化。

微信截图_20241230081446.png

FlagCX的架构设计遵循“零开销”与“零成本”原则,为上层应用提供统一的通信算子接口层,隐藏底层不同实现细节,并支持开发对接不同深度学习框架的插件,使用户能够在不同框架中无需额外成本使用FlagCX。FlagCX的设计与实现始终遵循标准化、兼容性和自适应三大原则。

性能测试表明,FlagCX在跨机通信性能上对厂商原生通信库的适配几乎无开销,且跨不同芯片的异构通信性能可达到峰值带宽的90%以上,展示了跨芯异构通信的巨大潜力。

智源研究院还致力于构建相关软件生态,推动产学研协同创新,加速异构统一通信库技术的推广和应用。首批生态伙伴包括高校及研究机构、服务器厂商、芯片厂商以及云服务提供商和运营商等。

FlagCX的开源地址为:https://github.com/FlagOpen/FlagCX