今日运势评分

4

本月运势

庚辰月

震荡偏多

丁破格,巳申合水
丙不修灶必见灾殃
辰不哭泣必主重丧

祭祀,出行,教牛马,扫舍,馀事勿取

开光,伐木,安葬,破土

月相

更待

底部反弹

日冲

Powered by RitMEX

TRUMP7.65 -1.10%

SUI2.13 1.53%

TON2.99 1.67%

TRX0.25 -0.08%

DOGE0.16 -0.22%

XRP2.08 -0.68%

SOL134.61 1.11%

BNB589.70 0.70%

ETH1587.29 -0.40%

BTC84612.94 0.35%

ETH Gas0.33 Gwei

恐惧
30

DeepSeek 扔的第二枚开源王炸到底是什么?

DeepSeek此次开源的全栈通信库DeepEP,通过优化GPU之间信息传输的效率,极大的缓解了从业者的算力焦虑。

作者:梁思琦

图片来源:由无界AI生成

2月25日,开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。因为直接解决了AI算力焦虑,GitHub瞬间飙出1500星(指收藏量),圈内集体炸锅,其重要性可见一斑。

很多人好奇DeepEP意味着什么?想象一下双十一的快递驿站:2048个快递小哥(GPU)在200个仓库(服务器)间疯狂搬运包裹(AI数据),传统运输系统就相当于让小哥们蹬三轮送货,而DeepEP直接给全员配上了“磁悬浮+量子传送”套装,稳定高效的传递信息。

特点一:直接改变运输规则

在2024年8月29日的英伟达电话会议上,黄仁勋曾经专门强调了NVLink(英伟达开发的一种让GPU之间直接互连的技术,双向互传速度可达1.8TB/S)对于低延迟、高输出和大型语言模型的重要性,认为它是推动大模型发展的关键技术之一。

然而这个被吹爆的NVLink技术,这次直接被中国团队玩出了新高度。DeepEP玄妙之处就在于对NVLink的优化,这意味着在同个仓库的快递员之间,用磁悬浮轨道运输,速度高达每秒158个集装箱(GB/s),相当于把北京到上海的距离缩短到喝一口水的时间。

黑科技二是其所包含的RDMA技术的低延迟内核,试想下,不同城市的仓库之间,货物直接“量子传送”,每架飞机(网卡)运力达每秒47个集装箱,还能让飞机一边装货一边飞行,计算与通信重叠,彻底告别停机等待。

特点二:智能分拣黑科技:AI版“最强大脑”

当货物需要分发给不同专家(MoE模型中的子网络)时,传统分拣员要逐个拆箱检查,而DeepEP的“调度-组合”系统就像拥有预知能力:在训练预填充模式,4096个数据包同时走智能传送带,自动识别同城或跨城件;在推理预填充模式,128个加急包裹走VIP通道,163微秒送达比人类眨眼快5倍。与此同时采用动态变轨技术,遇到流量洪峰秒切传输模式,完美适配不同场景需求。

特点三:FP8“缩骨术”

普通货物用标准箱子(FP32/FP16格式)运输,而DeepEP能把货物压缩成微型胶囊(FP8格式),同样卡车能多装3倍货物。更神奇的是,这些胶囊到达目的地后会自动恢复原状,既省邮费又省时间。

这套系统已在DeepSeek自家仓库(H800 GPU集群)实测:同城货运速度提升3倍,跨城延迟降低到人类难以感知的程度,而最颠覆性的是它实现了真正的"无感传输"——就像快递小哥边骑车边往快递柜里塞包裹,整个过程行云流水。

现在DeepSeek把这张王牌开源,相当于把顺丰的无人分拣系统图纸公之于众,原本需要2000台GPU的重型任务,现在几百台就能轻松拿捏。

在更早之前,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码,同样是减少大模型训练过程中成本的关键技术之一。为了缓解产业链上下游的成本焦虑,DeepSeek正在倾囊相授。

此前潞晨科技创始人尤洋在社交媒体发文表示,“短期内,中国的MaaS模式可能是最差的商业模式”,其简单估算,如果每日输出1000亿token,基于DeepSeek的服务每月的机器成本是4.5亿元,亏损4亿元;用AMD芯片月收入4500万元,月机器成本2.7亿元,这意味着亏损也超过2亿元。

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
作者 凤凰网
相关文章
2025.03.25 - 24 天前
从算力竞赛到算法革新:DeepSeek 引领的 AI 新范式
“我们只能看到很短的未来,但足以发现那里有很多工作要做。”
2025.03.10 - 39 天前
拒绝字节 3000 万美金收购,Manus 是 DeepSeek 级创新吗?
以一己之力让中国拿到AI竞争门票。
2025.03.04 - 45 天前
DeepSeek 利润神话背后:大厂 AI 的焦虑和自救
开源+免费,是一把“双刃剑”。
2025.03.03 - 46 天前
寻找 DeepSeek 梁文锋
投资机构等待下一个DeepSeek。
2025.03.03 - 46 天前
DeepSeek 日入 409 万,但“大厂平替”们仍深陷亏损泥潭
如果抱着发展的眼光看待AI大模型,就能发现,其与此前的互联网、移动App等技术类似,问世之初都面临商业化模糊的挑战。
2025.02.25 - 52 天前
DeepSeek 荣光下:落寞的“六小龙”
DeepSeek持续爆火下,本就走向分化的“六小龙”将加速洗牌。
2025.02.24 - 53 天前
当大家谈论 AI 颠覆游戏行业时,一线从业者这样用 Deepseek
与其说是革命,不如说是渗透。
2025.02.21 - 56 天前
实测百度搜索 DeepSeek 满血版:“为我所用”还是“拿来主义”?
百度搜索目前已全量上线DeepSeek满血版并提供联网服务,其中PC端开放仅1小时就有超千万人使用。
2025.02.20 - 57 天前
第一批 DeepSeek 开发者,已经开始逃离了
爆火之后,稳定成了刚需。
2025.02.19 - 58 天前
DeepSeek 们的成本,是怎么计算的?
大模型混战,一边卷能力,一边卷“成本”。