DeepSeek受华为拖累? 新模型被迫延迟发表


(北京14日综合电)据传,DeepSeek(深度求索)使用华为晶片训练发生困难,被迫从原定5月延后至未来数周发表新模型。
ADVERTISEMENT
英国《金融时报》引述知情人士报道称,DeepSeek今年1月推出R1模型后,在主管机关鼓励下改用华为昇腾处理器来取代辉达晶片。
然而,这家人工智能(AI)新创公司以昇腾晶片训练R2模型时持续遭遇技术问题,不得不改用辉达晶片来训练,华为晶片则用于推理(inference)。
知情人士披露,这正是DeepSeek新模型原定5月发表却延后的主因。
根据报道,华为曾派出工程团队进驻DeepSeek办公室,协助该公司使用昇腾晶片开发R2模型,但知情人士说,即使华为驻点支援,DeepSeek仍未能在昇腾晶片上成功完成一次训练。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT
