发布: 1:29pm 04/06/2025

防AI欺骗人类 “AI教父”拟开发“科学家AI”系统

“AI教父”将开发“科学家AI”系统防AI欺骗人类 — AI“教父”本吉奥宣布发起非营利组织LawZero，致力于开发“诚信”AI系统，防范AI欺骗人类。（法新社照片）

（纽约4日法新电）鉴于生成式人工智能（AI）的快速传播，一位AI先驱正开发软件，以监控这项日益取代人类任务的技术。

加拿大计算机科学教授本吉奥被认为是“AI革命的教父”之一，他于周二宣布成立非营利组织 LawZero，旨在降低该技术的固有风险。

这位图灵奖（又称计算机科学界的诺贝尔奖）的获得者多年来一直在警告AI的风险，无论是恶意使用还是软件本身出现问题。

随着所谓的AI代理人的发展，这些风险正在加剧。AI代理人是一种利用AI技术，让计算机做出曾经由人类工作者做出的决策。

AI代理人的目标是构建虚拟员工，使其能够完成几乎任何人类能够完成的工作，而成本仅为人类的一小部分。

本吉奥说道：“目前，AI的开发是为了实现利润最大化”，并补充说，尽管AI仍然存在缺陷，但人们仍在积极使用它。

此外，对于本吉奥来说，赋予AI类似人类的自主权很容易被用于恶意目的，例如虚假信息、生物武器和网络攻击。

他说道：“如果我们失去对流氓超级智能AI的控制，它们可能会极大地危害人类。”

作为护栏确保AI行为正常

LawZero表示，其首要目标之一是开发“科学家 AI”，这是一种经过特殊训练的AI，可以作为护栏，确保其他AI行为正常。

该组织目前拥有超过15名研究人员，并获得了由谷歌前老板施密特和夫人温迪创立的慈善机构施密特科学的资助。

该项目的启动正值OpenAI、谷歌和Anthropic等公司强大的大型语言模型（LLM）被部署到数字经济的各个领域，但仍然存在重大问题。

这些AI模型在提高生产力的同时，也暴露出欺骗和编造虚假信息的能力。

在最近的一个例子中，Anthropic披露，在安全测试期间，其最新的AI模型试图勒索一名工程师，以避免被另一个系统取代。

打开全文

百格视频

更多视频

AI

监控

AI教父

科学家AI

AI

监控

AI教父

科学家AI

防AI欺骗人类 “AI教父”拟开发“科学家AI”系统

作为护栏确保AI行为正常

热门新闻

百格视频

更多国际新闻

老师叫拿火烧黄蜂巢 11岁生遭爆炸烧伤全身校方竟拒绝负责

老家被恶火烧光！乐观妹子站在残骸前“微笑”合照

2025全球“最佳邮轮”榜单揭晓冠军拥三大优势

“越南屠夫”砍头煮尸身分竟是公务员

“两大钱坑”默默吞掉退休金！日本专家苦劝：快丢掉

史丹佛大学研究：一种疾病疫苗可望减少罹患失智症风险

热门话题

国际

国际拼盘

AI

监控

AI教父

科学家AI

AI

监控

AI教父

科学家AI

防AI欺骗人类 “AI教父”拟开发“科学家AI”系统

作为护栏确保AI行为正常

热门新闻

百格视频

更多国际新闻

老师叫拿火烧黄蜂巢 11岁生遭爆炸烧伤全身 校方竟拒绝负责

老家被恶火烧光！乐观妹子站在残骸前“微笑”合照

2025全球“最佳邮轮”榜单揭晓 冠军拥三大优势

“越南屠夫”砍头煮尸 身分竟是公务员

“两大钱坑”默默吞掉退休金！ 日本专家苦劝：快丢掉

史丹佛大学研究：一种疾病疫苗 可望减少罹患失智症风险

热门话题

老师叫拿火烧黄蜂巢 11岁生遭爆炸烧伤全身校方竟拒绝负责

2025全球“最佳邮轮”榜单揭晓冠军拥三大优势

“越南屠夫”砍头煮尸身分竟是公务员

“两大钱坑”默默吞掉退休金！日本专家苦劝：快丢掉

史丹佛大学研究：一种疾病疫苗可望减少罹患失智症风险