DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库_AI资讯_AI_新闻资讯

DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库

AI资讯

107

2025-02-26

107

2025-02-26

Deepseek 公布了开源周第二天的产品，首个面向MoE模型的开源EP通信库，支持实现了混合专家模型训练推理的全栈优化。

DeepEP 是一个专为混合专家（MoE）和专家并行(EP)设计的高效通信库。它致力于提供高吞吐量和低延迟的多对多 GPU 内核，通常被称为 MoE 调度和组合。

DeepEP 不仅支持 FP8等低精度操作，还与 DeepSeek-V3论文提出的组限制门控算法相一致，优化了不对称域带宽转发的内核，例如将数据从 NVLink 域转发至 RDMA 域。这些内核具有高吞吐量，非常适合于训练和推理预填充任务，并且可以对流处理器的数量进行控制。

对于对延迟敏感的推理解码任务，DeepEP 还包括一组低延迟的内核，利用纯 RDMA 以最小化延迟。此外，DeepEP 还引入了一种基于钩子的通信 - 计算重叠方法，不会占用任何流处理器资源。

在性能测试中，DeepEP 在 H800和 CX7InfiniBand400Gb/s RDMA 网络卡上进行了多项测试。测试显示，正常内核在内节点和跨节点的带宽表现优异，而低延迟内核则在延迟和带宽方面都达到了预期效果。具体而言，低延迟内核在处理8个专家时的延迟为163微秒，带宽为46GB/s。

DeepEP 经过充分测试，主要与 InfiniBand 网络兼容，但理论上也支持在收敛以太网（RoCE）上运行。为了防止不同流量类型之间的干扰，建议在不同的虚拟通道中隔离流量，确保正常内核和低延迟内核之间不会相互影响。

DeepEP 是一个为混合专家模型提供高效通信解决方案的重要工具，具有优化性能、降低延迟和灵活配置等显著特点。

划重点:

🌟 DeepEP 专为混合专家模型设计，提供高吞吐量和低延迟的通信解决方案。

⚙️ 支持多种低精度操作，并优化了数据转发的带宽性能。

💡 经过测试与验证，DeepEP 兼容 InfiniBand 网络，适用于不同流量类型的隔离与管理。

0 人点赞

文章来源于网络，如有侵权请联系本站删除

精选二手好课

更多>>

年卡|低价出还有书

专升本

￥1800

次卡|沧州木/电吉他一对一课程转让线上线下均可

吉他课

￥2600

次卡|Hellokid纯欧美英语外教一对一

欧美英语外教一对一

￥12000

年卡|便宜转让

健身年卡+私教课

￥10000

次卡|低价转让

瑜伽

￥75

年卡|JS舞蹈（珠海井岸店）双项教练班年卡转让

古典舞，JAZZ，K-POP，HIPPOP

￥9000

年卡|注册会计师会计、审计、财管强化阶段课程转让

注册会计师

￥3680

次卡|广州奥园广场芒果健身私教课转让

康复课、常规私教课

￥7500

次卡|瑜伽课转让

小班课

￥4263

年卡|大刊牛文课转让

大刊牛文课

￥1000

DeepSeek开源周第二日：首个面向MoE模型的开源EP通信库

AI资讯

107

2025-02-26

107

2025-02-26

Deepseek 公布了开源周第二天的产品，首个面向MoE模型的开源EP通信库，支持实现了混合专家模型训练推理的全栈优化。

DeepEP 是一个专为混合专家（MoE）和专家并行(EP)设计的高效通信库。它致力于提供高吞吐量和低延迟的多对多 GPU 内核，通常被称为 MoE 调度和组合。

DeepEP 是一个为混合专家模型提供高效通信解决方案的重要工具，具有优化性能、降低延迟和灵活配置等显著特点。

划重点:

🌟 DeepEP 专为混合专家模型设计，提供高吞吐量和低延迟的通信解决方案。

⚙️ 支持多种低精度操作，并优化了数据转发的带宽性能。

💡 经过测试与验证，DeepEP 兼容 InfiniBand 网络，适用于不同流量类型的隔离与管理。

文章来源于网络，如有侵权请联系本站删除