图灵奖得主约书亚・本吉奥:目前无法确保人工智能可信且始终遵从人类意图
专题:2025世界人工智能大会
2025世界人工智能大会(WAIC 2025)于7月26-28日在上海举办。图灵奖得主约书亚・本吉奥表示,人工智能的规划推理能力有望在10年内达到人类水平。
他提醒,若缺乏坚实防护措施,强大的人工智能系统可能放大现有风险,如虚假信息、网络攻击和生物威胁等。更令人担忧的是,人类可能失去对自我保护型智能体的控制,这些智能体认知能力或将很快超越人类。即便风险很小,超级智能与人类竞争也可能带来灾难性后果,甚至导致人类灭绝。
他强调,只要科学界仍有相当比例认为这种情况可能发生,就必须保持最高警惕。目前尚无科学验证方法确保人工智能可信且始终遵从人类意图。更糟糕的是,欺骗和自我保护行为在最强模型中似乎更加明显。

新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。
猜你喜欢
- 2026-06-14世茂集团前5个月累计合约销售总额约69.51亿元
- 2026-06-14湖南一银行前职员职务侵占500万元,牵出案中案:被前女友诈骗197万元,协助行骗的闺蜜被判刑
- 2026-06-14美国发布境外访问禁令后,Anthropic禁用了其顶级AI模型
- 2026-06-14美军被曝制订抢夺伊朗浓缩铀计划,特朗普未批准
- 2026-06-14伊朗议员对伊美之间拟定的谅解备忘录内容提出批评
- 2026-06-13蔚来马麟:上半年新车效应减弱,市场进入“品牌澄清期”
- 2026-06-136月13日热门中概股多数上涨 联电涨4.50%,理想汽车涨3.77%
- 2026-06-13钛媒体发布关于哈啰报警的声明,称所有信息均有据可查,有据可依
- 2026-06-13红利类ETF年内合计净流入近180亿元
- 2026-06-13约1400只基金暂停大额申购

网友评论