简

ADVERTISEMENT

ADVERTISEMENT

发布: 2:16pm 06/03/2025

AI

图灵奖

强化学习

AI

图灵奖

强化学习

研究强化学习 AI开发先驱获图灵奖

马萨诸塞大学退休教授巴托。（美联社照片）

加拿大亚伯塔大学终身教授萨顿。（美联社照片）

(马萨诸塞6日综合电）强化学习领域的两位人工智能（AI）开发先驱、电脑科学家巴托和萨顿，周三荣获被视为科技界的诺贝尔奖的“图灵奖”。

ADVERTISEMENT

76岁的巴托和67岁的萨顿是师生关系，这对师徒1970年代末期开始进行强化学习研究，为过去10年AI部分发展舖路。

他们的研究核心采用类似驯犬师或驯马师的训练行为作法，引导所谓“享乐”(hedonistic)机器，让机器根据接收到的正面讯号，不断调整行为。

强化学习让Google电脑程式在2016年和2017年击败围棋界人类顶尖高手，也是改善ChatGPT等流行AI工具、优化金融交易、协助机械手解决魔术方块的关键技术。

巴托向美联社表示，他和萨顿刚开始在阿默斯特马州大学研究理论和演算法时，强化学习领域“并不时髦”；“当时就像在荒野中开路，现在这块领域越来越被认可，还被认为是很有趣的事；和早期情况大不同。所以，获得这个奖令我深感欣慰。”

巴托已从马萨诸塞州大学退休14年，萨顿现在是加拿大亚伯塔大学终身教授。

图灵是英国数学家，在二次大战期间设计出破解德军无线电密码的机器，协助盟军拦截击沉无数德国潜艇，1947年提出“机器能从经验中学习”的假说，被誉为AI先锋。

巴托和萨顿的研究就是以图灵的学说为基础。萨顿称之为“强化学习的基本思想”。

图灵奖的100万元奖金由谷歌赞助。

打开全文

ADVERTISEMENT

热门新闻

百格视频

更多视频

更多国际新闻

视频 | 骑脚车搭手扶梯男子连人带车惨摔

视频 | 骑脚车搭手扶梯男子连人带车惨摔

17分钟前

澳16岁以下青少年社媒禁令 Reddit指责“法律上是错误的”

澳16岁以下青少年社媒禁令 Reddit指责“法律上是错误的”

22分钟前

柬控泰军投毒烟弹攻击　有平民在公路被炸死

柬控泰军投毒烟弹攻击　有平民在公路被炸死

25分钟前

查个资外泄案韩国警方搜查扣押酷澎总公司

查个资外泄案韩国警方搜查扣押酷澎总公司

28分钟前

“忍了超过24小时” 洪森称柬埔寨已“报复”

“忍了超过24小时” 洪森称柬埔寨已“报复”

55分钟前

视频 | 车厢打翻奶茶用围巾擦干获赞女子获地铁公司送礼道谢

视频 | 车厢打翻奶茶用围巾擦干获赞女子获地铁公司送礼道谢

58分钟前

热门话题

ADVERTISEMENT

ADVERTISEMENT

点击

可阅读下一则新闻

ADVERTISEMENT