星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

国际

|

即时国际

发布: 1:14pm 01/02/2025

辉达

出口管制

GPU

DeepSeek

幻方量化

辉达

出口管制

GPU

DeepSeek

幻方量化

DeepSeek低成本骗人? 研究机构:GPU支出逾5亿美元

DeepSeek低成本骗人? 研究机构:GPU支出逾5亿美元
研究机构SemiAnalysis认为,DeepSeek的支出超过5亿美元(22.31亿令吉)。(法新社照片)

(纽约1日综合电)中国新创公司的模型成本引发质疑,并且造成股市震荡。研究机构SemiAnalysis在报告中指出,光是硬体绘图处理器()上的支出远超过5亿美元(22.31亿令吉)。

SemiAnalysis指出,中国对冲基金(High-Flyer)在2023年5月成立推动AI技术研究。之前,幻方量化于2021年,也就是任何生效前投资购买1万颗A100 GPU,光在投资上已超过5亿美元。

ADVERTISEMENT

报告说,辉达根据法规要求生产了多款H100的变化版,比如H800、H20,仅有H20可销售予中国。辉达过去9个月来已生产超过100万颗专供中国市场的H20 GPU。分析显示,DeepSeek的伺服器总资本支出(CapEx)约16亿美元(71.38亿令吉)。

DeepSeek从中国本土招募人才,目前约有150名员工,仍在急速扩张。DeepSeek的价格和效能在本周因出现模型训练成本低于600万美元(2676万令吉)的说法引起讨论。报告强调,训练成本仅是总成本的一小部分,不代表完整支出。

DeepSeek论文中提到的600万美元成本是指预训练运行(pre-training run)时的GPU成本,是模型总成本的一部分,未算入重要支出包括研发、硬体总拥有成本的关键因素。

报道也提到,DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。

美国智库兰德公司(RAND)研究人员海姆分析,硬体的出口管制存在时间滞后,目前尚未完全发挥影响力。真正的考虑将出现在数据中心需要升级或扩展时,这对美国企业较为容易,可是对出口管制的中国企业而言将是挑战。

ADVERTISEMENT

热门新闻

百格视频

ADVERTISEMENT

点击 可阅读下一则新闻

ADVERTISEMENT