研究强化学习 AI开发先驱获图灵奖




(马萨诸塞6日综合电)强化学习领域的两位人工智能(AI)开发先驱、电脑科学家巴托和萨顿,周三荣获被视为科技界的诺贝尔奖的“图灵奖”。
ADVERTISEMENT
76岁的巴托和67岁的萨顿是师生关系,这对师徒1970年代末期开始进行强化学习研究,为过去10年AI部分发展舖路。
他们的研究核心采用类似驯犬师或驯马师的训练行为作法,引导所谓“享乐”(hedonistic)机器,让机器根据接收到的正面讯号,不断调整行为。
强化学习让Google电脑程式在2016年和2017年击败围棋界人类顶尖高手,也是改善ChatGPT等流行AI工具、优化金融交易、协助机械手解决魔术方块的关键技术。
巴托向美联社表示,他和萨顿刚开始在阿默斯特马州大学研究理论和演算法时,强化学习领域“并不时髦”;“当时就像在荒野中开路,现在这块领域越来越被认可,还被认为是很有趣的事;和早期情况大不同。所以,获得这个奖令我深感欣慰。”
巴托已从马萨诸塞州大学退休14年,萨顿现在是加拿大亚伯塔大学终身教授。
图灵是英国数学家,在二次大战期间设计出破解德军无线电密码的机器,协助盟军拦截击沉无数德国潜艇,1947年提出“机器能从经验中学习”的假说,被誉为AI先锋。
巴托和萨顿的研究就是以图灵的学说为基础。萨顿称之为“强化学习的基本思想”。
图灵奖的100万元奖金由谷歌赞助。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT
