直击WAIC | 图灵奖得主约书亚・本吉奥:欺骗和自我保护行为在强模型中更加明显
专题:2025世界人工智能大会
2025世界人工智能大会(WAIC 2025)于7月26-28日在上海举办。图灵奖得主约书亚・本吉奥表示,人工智能的规划推理能力有望在10年内达到人类水平。
他提醒,若缺乏坚实防护措施,强大的人工智能系统可能放大现有风险,如虚假信息、网络攻击和生物威胁等。更令人担忧的是,人类可能失去对自我保护型智能体的控制,这些智能体认知能力或将很快超越人类。即便风险很小,超级智能与人类竞争也可能带来灾难性后果,甚至导致人类灭绝。
他强调,只要科学界仍有相当比例认为这种情况可能发生,就必须保持最高警惕。目前尚无科学验证方法确保人工智能可信且始终遵从人类意图。更糟糕的是,欺骗和自我保护行为在最强模型中似乎更加明显。

新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
猜你喜欢
- 2026-06-14中金:周大福维持“跑赢行业”评级 目标价15.86港元
- 2026-06-14世界杯,意大利真的消失了吗?
- 2026-06-14奥迪威继续冲刺“北+H”:招股书现低级错误,三个年度冒出四个数据
- 2026-06-14公募基金重要新规来了,划定“80%红线”
- 2026-06-14雷军回应“用私家车装600斤车厘子被指违规”,交警发声
- 2026-06-14evereden柏林甫:做产品一味模仿只会陷入成本、营销、价格的多重焦虑
- 2026-06-14蓝月亮两年亏超10亿港元,高管涨薪千万至4797万港元,累计分红已超累计净利润
- 2026-06-14零跑汽车徐军:未来十年汽车行业进入微利常态,打法从“敢、快”转向“精、灵”
- 2026-06-13分众传媒陈岩:AI深度左右消费者心智
- 2026-06-13SpaceX业务一极盈利两极亏损 累计亏损达413亿美元

网友评论