星洲网
星洲网
星洲网 登入
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动

ADVERTISEMENT

ADVERTISEMENT

国际

|

即时国际

发布: 2:16pm 06/03/2025

AI

图灵奖

强化学习

AI

图灵奖

强化学习

研究强化学习 AI开发先驱获图灵奖

马萨诸塞大学退休教授巴托。(美联社照片)
加拿大亚伯塔大学终身教授萨顿。(美联社照片)

(马萨诸塞6日综合电)领域的两位人工智能()开发先驱、电脑科学家巴托和萨顿,周三荣获被视为科技界的诺贝尔奖的“”。

ADVERTISEMENT

76岁的巴托和67岁的萨顿是师生关系,这对师徒1970年代末期开始进行强化学习研究,为过去10年AI部分发展舖路。

他们的研究核心采用类似驯犬师或驯马师的训练行为作法,引导所谓“享乐”(hedonistic)机器,让机器根据接收到的正面讯号,不断调整行为。

强化学习让Google电脑程式在2016年和2017年击败围棋界人类顶尖高手,也是改善ChatGPT等流行AI工具、优化金融交易、协助机械手解决魔术方块的关键技术。

巴托向美联社表示,他和萨顿刚开始在阿默斯特马州大学研究理论和演算法时,强化学习领域“并不时髦”;“当时就像在荒野中开路,现在这块领域越来越被认可,还被认为是很有趣的事;和早期情况大不同。所以,获得这个奖令我深感欣慰。”

巴托已从马萨诸塞州大学退休14年,萨顿现在是加拿大亚伯塔大学终身教授。

图灵是英国数学家,在二次大战期间设计出破解德军无线电密码的机器,协助盟军拦截击沉无数德国潜艇,1947年提出“机器能从经验中学习”的假说,被誉为AI先锋。

巴托和萨顿的研究就是以图灵的学说为基础。萨顿称之为“强化学习的基本思想”。

图灵奖的100万元奖金由谷歌赞助。

打开全文

ADVERTISEMENT

热门新闻

百格视频

ADVERTISEMENT

点击 可阅读下一则新闻

ADVERTISEMENT