NVIDIA计算卡被华为取代过程扰乱训练 导致DeepSeek R2模型推迟!!

本站开启邀请码注册,最新邀请码获取: https://t.me/tearcc

5毛尴尬!狗咬狗了!
lol.gif


原来连用都不能用,我原本以为只是慢一些呢
titter.gif






=================================================

中国坚持要求企业使用国产AI芯片而非英伟达芯片,这会不会付出一些代价?据一份新报告称,北京方面曾敦促DeepSeek放弃英伟达硬件,转而在其R2型号中使用华为芯片,但训练过程中不断出现技术问题,导致发布推迟,并被迫重新转向NVIDIA进行训练,而推理部分则使用了华为芯片。





今年 1 月,DeepSeek 的 R1 模型发布时震惊了整个人工智能行业。据称,该模型在 2048 块英伟达 H800 上进行了训练,耗资 557.6 万美元,与其他人工智能公司数十亿美元的投入相比只是零头。但后来有消息称,DeepSeek 使用了大约 5 万块 Hopper GPU,其中包括 1 万块 H800 和 1 万块 H100,以及 3 万块 HGX H20 单元。



据《金融时报》援引三位知情人士的话称,对于 R2 的后续型号,中国当局“鼓励”DeepSeek 放弃 NVIDIA 技术,转而使用国产硬件。



DeepSeek 采纳了这一建议(或者说需求),转而使用华为基于昇腾平台进行 R2 版本的训练。然而,这带来了性能不稳定、互联速度变慢以及华为 CANN 软件工具包限制等问题。



华为派出了一个工程师团队前往DeepSeek的数据中心,希望解决这些问题。尽管他们已经到位,但在Ascend平台上进行的训练从未成功过,不过使R2与Ascend兼容推理的工作仍在继续。

精彩评论


我爱我家 发表于3 分钟前

funk.gif
 
后退
顶部