星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

国际

|

带你看世界

发布: 4:08pm 18/09/2025

DeepSeek

梁文锋

《自然》

DeepSeek

梁文锋

《自然》

梁文锋DeepSeek论文登上《自然》封面

看世界两图)梁文锋DeepSeek论文登上《自然》封面
Deepseek论文登上《自然》封面。(互联网照片)

(北京18日综合电)中国人工智能公司深度求索()创始人有关DeepSeek-R1大语言模型的论文,登上了学术期刊的封面。

据《科技日报》报道,梁文锋及DeepSeek团队周三(17日)在《自然》封面发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。

ADVERTISEMENT

论文称,模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,这一模型通过解决问题获得奖励,从而强化学习效果。

团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

看世界两图)梁文锋DeepSeek论文登上《自然》封面
论文标题为《​通过强化学习激励DeepSeek-R1的大型语言模型推理》。(互联网照片)

《自然》在社论中称,目前没有任何一种主流大型语言模型在学术期刊中经历过独立的同行评审,这一状况随着《自然》杂志发表有关R1模型的详细信息而发生变化。

社论称,R1模型已经过八名专家评审,评估了原创性、方法论和稳健性,并呼吁其他公司效仿DeepSeek的做法。“在一个未经证实的言论和炒作屡见不鲜的行业中,所有这些都是朝着透明度和可重复性迈出的可喜一步。”

ADVERTISEMENT

热门新闻

百格视频

ADVERTISEMENT

点击 可阅读下一则新闻

ADVERTISEMENT