AI高考数学全不及格 语数英最高分303

上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果

AI高考数学全不及格 语数英最高分303

游民星空

下载游民App,掌握一手游戏情报

AI高考数学全不及格 语数英最高分303

微博 新浪科技 2024-06-19 23:28
0

据新浪科技报道,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。OpenCompass发布了首个大模型高考全卷评测结果。

游民星空

语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAl的GPT-4o排名第二,得分296分,上海人工智能实验室的书生浦语2.0排名第三,三个大模型的得分率均超过70%。来自法国大模型初创公司的Mistral排名末尾。

游民星空

从结果来看,大模型的语文、英语考试水平普遍不错但数学都不及格,最高分也只有75分。

游民星空

责任编辑:益达兄

APP精彩推荐打开游民APP查看更多

相关内容 打开游民APP查看更多

在线玩推荐更多