用魔法打败魔法科学家用AI打败“AI幻觉”|游民星空

当用户向AI语言模型提出问题时，有时AI给出的答案简直就是胡说八道，也叫“AI幻觉”。更加阴险的是，它还会编造出一大堆理由，让谎言听起来很有道理，这让人很难区分真假。

现在，英国牛津大学的科学家给出了一个识别AI谎言的方法，真正的是“用魔法打败魔法”，他们利用AI揭开AI的谎言。

科学家发现，如果反复向AI问同一个问题，且得到的答案每次都一致，这说明可信度较高，否则可信度较低。基于此，可以在现有AI模型中集成AI“警察”控制AI幻觉，目前而言很容易。不过，科学家称，该方法也有缺点，比如AI响应会被延迟，并带来高昂的计算成本。

另外，可能无法识别AI所有谎言。如果所有AI都联合起来坚持自己的谎言，一遍又一遍的重复答案，这时就无能为力了。

责任编辑：宁静海

用魔法打败魔法科学家用AI打败“AI幻觉”