加入收藏 | 设为首页 | 会员中心 | RSS

今天是: 发布信息

您当前的位置：首页 > 闽商人物

AI高考状元：文科超一本，理科超二本又一新谍战片定档，影帝甘愿作配，导演实力惊人，男主竟是她（二本）2021年全国高考文理科状元，

时间：2024-08-07 02:56:13 来源：闽商界作者：闽商界点击:

凤凰网科技讯 7月19日，上海人工智能实验室公布了大模型开源开放评测体系司南对7个AI大模型进行了高考全科目测试结果。结果显示：书生·浦语2.0系列文曲星大模型（浦语文曲星）、阿里通义千问大模型Qwen2-72B以及GPT-4o再次包办文、理科前三甲；前三名AI“考生”的文、理科结果分别凌驾了“一本”“二本”线（以今年高考人数最多的河南省的分数线为参考）。

从官方提供的测试结果来看，前三甲“考生”达一本水平，大部门模型未到二本线。其中，阿里通义千问大模型Qwen2-72B以546分的结果获得AI高考“文科状元”，浦语文曲星则以468.5分成为理科第一名。

在文科结果方面，Qwen2-72B、浦语文曲星、GPT-4o的文科结果均逾越“一本线”，展现了大模型在语文、历史、地理、思想政治等科目上深厚的知识储备和理解能力。而在理科结果方面，AI“考生”整体体现弱于文科，体现了大模型在数理推理能力上普遍存在短板。

据悉，本次评测具有几大特点：

1. 全卷考试：进行全卷评分，而不但针对单一题型，且包罗带图的高考题

2. 考前开源：评测覆盖的开源模型均为今年高考前开源的模型，排除泄题的可能性

3. 老师打分：邀请有高考阅卷经验的老师打分，确保评分和高考尽量一致

4. 完全公开：生成答案的代码、模型答卷、评分结果完全开源

在此次测试中，阅卷老师们一致认为，大模型与真人考生依然存在差距。具体而言，在作答主观题时，大模型往往无法完整理解题干，不明白代词指向，结果导致答非所问；解答数学题时，解题过程机械且逻辑性差，对于几何题，常出现与空间逻辑相违背的推断；对物理、化学实验理解肤浅，无法准确识别并运用实验器材。

别的，大模型也会伪造虚构内容，编造看似合理但实际不存在的诗句，或在存在明显计算错误的情况下之后不反思，“硬着头皮蒙”一个答案，均给阅卷老师带来了困扰。

通过盘点AI“考生”的答卷，司南的模型评测团队深入分析了当前大模型普遍存在的问题：反思能力弱、“一本正经”虚构内容、缺乏空间想象能力以及对物理、化学实验理解肤浅。

推荐资讯

福建省习近平新时代中国特色社会主义思想研究中心2025年度工作会议召开
一艘外轮在福州罗源湾触礁搁浅后获救
赵龙在厦门大学调研
赵龙会见国际奥委会主席巴赫
厦门航空开通福州往返金边直飞航线
六国总领事走进福建泉州共度元宵佳节
莆田，一座“闹春”的城市
赵龙在福建省中小企业服务中心调研时强调：强化产品供需对接用好“四通四到”机制  切实为中小企业发展解难题增活力
赵龙调研国企改革工作并召开座谈会
德国留学生福建体验“中国客家狂欢节”

相关文章

无相关信息

栏目更新

中国银行股价上扬2.16%：银行业复苏信号？还是短期颠簸？（中行）中国银行股票价格走势，

曼恩斯特：阿布扎比投资局、韩国银行等多家机构于9月5日调研我司如果雄阔海和罗成公平单挑，谁能赢？他们两人的差距到底在哪里？（银行）阿布扎比收购曼城，

蚂蚁保发布智能保险服务开放平台“蚁桥”：打造“AI+人工”服务新范式溥仪晚年与妻子游玩故宫，无意间碰到一个老头，脸色立刻大变（保险）蚂蚁保险百度百科，

海量财经丨明确贷款余额上限、严禁出租出借牌照小额贷款公司将迎监管新规马未都：千载风华映臂钏，汉唐雅韵探幽途（财经新闻）剩余贷款金额计算器，

新闻1+1丨开门迎客来！如何让“中国行”圈粉更多外国游客？难怪宋江死不敷惜，他对阎婆惜和李逵的所作所为，人到中年才读懂（中国新闻）开门迎客下一句，

开盘：三大股指微幅低开民爆、基建及贵金属板块普跌2024年流行“裙子+裤子”！赵露思、娜扎宋雨琦等明星穿出时尚感（基建）a股三大股指低开，

安徽16城上半年GDP出炉！合肥第一，“一城独大”如何突围？（GDP）安徽省各市上半年gdp排名，

打造大户型家居指南：如何充实享受舒适生活对“老女人”情有独钟的谢霆锋，张柏芝是意外，低颜值姐姐是真爱（生活）大户型室内装修效果图大全，

研究生分为“3个档次”,第三类上岸简单但含金量最低,你看好哪个?（研究生）考研一般多少分就稳了，

考上披着“二本外衣”的三本，缴了一万多学费，考生吃不亏损？曾经演戏嫌水脏，换149桶矿泉水的女星，现在总算心满意足火了（二本）二本学费贵还是三本学费贵，

栏目热门

中行四川分行：深入实施“四化同步、城乡融合、五区共兴”发展战略奋力助推新时代治蜀兴川将花朵元素组合成包包，花朵肩包编织教程，仿佛闻着花香春天来了（中行）中国银行四川省分行新任行长是谁，

保姆级建行攒分攻略，看完再也不愁大山白年费（建行）建行的积分是怎么来的，

曼恩斯特接待6家机构调研，包罗阿布扎比投资局、韩国银行、日兴资产管理公司等为何公鸡打鸣正常，母鸡打鸣就要被宰？老人的话还是有科学依据的（银行）曼恩斯特报酬，

基金早班车丨基金医药持仓继续下滑，基民借道ETF放肆抄底女子堵气准备回娘家，开门发现母亲：跟你爸吵架想来你家借住两天（基金）基金赚钱、基民亏钱，

别慌，除了打和骂，还有好多真正值得一用的教育方法（教育）除了打孩子还有什么处罚步调，

面对涨价吐槽，“有为政府”当有作为（政府）如何看待涨价问题，

全港昨天都在议论的事，特区政府深夜发了声明！（政府）香港特别行政区政府新闻公报，

我国外汇储备：7 月末升 1.06% 央行停增金储全红婵父亲的言论再次成为全国热搜，广东网友：这才是最好的家风（人民银行）我国外汇储备走势，

31省份上半年GDP出炉：16地增速跑赢全国，内蒙古最快（GDP）31省区市上半年gdp出炉，

区长访谈｜浦东：高质量发展就是为了让老黎民过好日子外籍博士称：郑和下西洋是骗局！留学生提一个问题，让他无言以对（黎民）浦东新区讲话，

网站首页 | 关于我们 | 服务条款 | 广告服务 | 给我留言 | 网站地图 | 友情链接 | 手机浏览 | 返回顶部

闽商界 http://www.minshangjie.com/ ICP备案号：闽ICP备18009233号-12

广告/报障电话:17859716698(8:00-22:00)/ Email:215858170@qq.com

Copyright © 2018-2019 www.minshangjie.com All Rights Reserved