关注我们: 微信公众号

扫码关注我们

DeepSeek R2 因芯片问题而推迟发布!

云头条 2025-08-14 49

2025 年 8 月 14 日,英国《金融时报》报道,DeepSeek 在使用昇腾芯片训练 R2 的过程中遇到了持续的技术问题,促使其使用英伟达芯片进行训练,使用华为芯片进行推理。

8.14.png

这些问题是该模型发布日期从 5 往向推迟的主要原因。
训练是通过海量数据对模型进行参数优化的过程,推理则是指在模型训练完成后,利用其对新输入数据进行预测或生成输出的过程(如问答系统的回答生成)。

华为派了「一个工程师团队」前往 DeepSeek 的办公室,帮助使用昇腾芯片开发 R2 模型。

尽管团队派驻现场,DeepSeek 仍无法在昇腾芯片上成功进行训练。

原因为昇腾平台在训练任务中的稳定性不足、软硬件支持不完善,以及芯片之间通信速度较慢等问题。

DeepSeek 仍在与华为进行合作,以确保其模型与昇腾兼容以完成推理任务

DeepSeek 创始人梁文在内部表示,他对 R2 取得的进展并不满意,并一直在竭力投入更多时间来研发一款能够让该公司在 AI 领域保持领先地位的先进模型。

R2 的发布因更新模型的数据标注时间超出预期而被推迟。

两张.png

关键词:

网友留言2

未查询到任何数据!
◎欢迎您留言咨询,请在这里提交您想咨询的内容。