用魔法打败魔法 科学家用AI打败“AI幻觉”

当用户向AI语言模型提出问题时,有时AI给出的答案简直就是胡说八道,也叫“AI幻觉”。现在,英国牛津大学的科学家给出了一个识别AI谎言的方法,他们利用AI揭开AI的谎言。

用魔法打败魔法 科学家用AI打败“AI幻觉”

游民星空

下载游民App,掌握一手游戏情报

用魔法打败魔法 科学家用AI打败“AI幻觉”

微博 智慧科技迷 2024-06-24 15:15
0

当用户向AI语言模型提出问题时,有时AI给出的答案简直就是胡说八道,也叫“AI幻觉”。更加阴险的是,它还会编造出一大堆理由,让谎言听起来很有道理,这让人很难区分真假。

现在,英国牛津大学的科学家给出了一个识别AI谎言的方法,真正的是“用魔法打败魔法”,他们利用AI揭开AI的谎言。

游民星空

科学家发现,如果反复向AI问同一个问题,且得到的答案每次都一致,这说明可信度较高,否则可信度较低。基于此,可以在现有AI模型中集成AI“警察”控制AI幻觉,目前而言很容易。不过,科学家称,该方法也有缺点,比如AI响应会被延迟,并带来高昂的计算成本。

另外,可能无法识别AI所有谎言。如果所有AI都联合起来坚持自己的谎言,一遍又一遍的重复答案,这时就无能为力了。

游民星空

责任编辑:宁静海

APP精彩推荐打开游民APP查看更多

相关内容 打开游民APP查看更多

在线玩推荐更多