防AI欺骗人类 “AI教父”拟开发“科学家AI”系统



(纽约4日法新电)鉴于生成式人工智能(AI)的快速传播,一位AI先驱正开发软件,以监控这项日益取代人类任务的技术。
加拿大计算机科学教授本吉奥被认为是“AI革命的教父”之一,他于周二宣布成立非营利组织 LawZero,旨在降低该技术的固有风险。
ADVERTISEMENT
这位图灵奖(又称计算机科学界的诺贝尔奖)的获得者多年来一直在警告AI的风险,无论是恶意使用还是软件本身出现问题。
随着所谓的AI代理人的发展,这些风险正在加剧。AI代理人是一种利用AI技术,让计算机做出曾经由人类工作者做出的决策。
AI代理人的目标是构建虚拟员工,使其能够完成几乎任何人类能够完成的工作,而成本仅为人类的一小部分。
本吉奥说道:“目前,AI的开发是为了实现利润最大化”,并补充说,尽管AI仍然存在缺陷,但人们仍在积极使用它。
此外,对于本吉奥来说,赋予AI类似人类的自主权很容易被用于恶意目的,例如虚假信息、生物武器和网络攻击。
他说道:“如果我们失去对流氓超级智能AI的控制,它们可能会极大地危害人类。”
作为护栏确保AI行为正常
LawZero表示,其首要目标之一是开发“科学家 AI”,这是一种经过特殊训练的AI,可以作为护栏,确保其他AI行为正常。
该组织目前拥有超过15名研究人员,并获得了由谷歌前老板施密特和夫人温迪创立的慈善机构施密特科学的资助。
该项目的启动正值OpenAI、谷歌和Anthropic等公司强大的大型语言模型(LLM)被部署到数字经济的各个领域,但仍然存在重大问题。
这些AI模型在提高生产力的同时,也暴露出欺骗和编造虚假信息的能力。
在最近的一个例子中,Anthropic披露,在安全测试期间,其最新的AI模型试图勒索一名工程师,以避免被另一个系统取代。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT
