震撼!2025 高考数学难吗,七家大模型应战,DeepSeek、讯飞星火竟率先破 140!
开心田螺
2025-06-09 10:59:49
0

2025 年,七家主流大模型也加入了高考这场没有硝烟的 “战争”,本以为会是一场势均力敌的较量,却没想到 DeepSeek 和讯飞星火竟一骑绝尘,率先突破 140 分,让其他模型望尘莫及!

2025 年高考数学刚刚落下帷幕,关于试卷难度的讨论在网络上热度爆棚。而一场特别的 “考试” 也随之展开,七位 AI 大模型 “考生” 受邀参与,它们分别是 DeepSeek R10528、通义千问 Qwen3 - 235B - A22B、讯飞星火 X1 - 0420、豆包 Seed - Thinking - v1.5、文心 X1 Turbo、腾讯混元 Hunyuan T1 latest 以及 GPT o3。

为确保本次 “考试” 评测的准确性,不仅采用了多版本交叉验证,还邀请了拥有十年高中数学教研经验的专家汪鹏老师负责评分。

考试开始,在基础的选择题部分,各模型都表现不错,均顺利答对。然而,随着题目难度上升,差异逐渐显现。在涉及对数函数的选择题中,DeepSeek 和豆包出现了错误。

在解答题第 16 题中,DeepSeek、通义千问、讯飞星火和豆包表现优异,展示了清晰的解题过程,获得满分,而文心 X1 和腾讯混元则出现了不同程度的错误。

难度更高的第 18 题,讯飞星火、豆包、DeepSeek、通义千问和 GPT o3 获得满分,文心 X1 因答案错误失分。

最终成绩揭晓,DeepSeek 以 143 分的成绩勇夺榜首,讯飞星火以 141 分紧随其后,GPT o3 以 138 分位居第三。这场大模型的 “高考数学之战”,让我们看到了 AI 在数学领域的强大实力与无限潜力。

那么问题来了,随着 AI 技术不断发展,未来它们能否在教育领域彻底颠覆传统教学模式呢?让我们拭目以待。

相关内容

热门资讯

小学生开学收心全攻略:6个实用... 小学生开学收心全攻略:6个实用方法让孩子快速进入状态 暑假的欢笑声还未散尽,开学的脚步声已悄然临近。...
挖到软考高项真题!案例 + 论... 备考信息系统项目管理师的宝子们!刚挖到2024 年 5 月新鲜真题包(含 2 批案例 + 选择 + ...
从“吵闹课堂”到“有序互动”:... 从“吵闹课堂”到“有序互动”: 3个小游戏让幼儿园常规管理效率翻倍 金翅膀儿童教育 ——您身边的幼儿...
讲真!这8个成人高考专业真的很... 大部分同学在高考选志愿的时候,就已经在选择、决定或想象自己今后的职业了。所以当初在选专业的时候,可能...
湖北专升本汉语言文学理论高频考... 汉语言文学属于文科专业,需要背很多知识点,理解背诵才能在做题的时候拿到更高的分数。小编根据近几年湖北...
孙子满月宴上,大舅嫂帮忙写账单... 口述:杨桂荣 整理∶文鸢 我两个闺女一个儿子。 儿子最小,打出生起,我和他爸就对他呵护备至,捧在手心...
非网络架构类概念解析:探索其定... 网络拓扑结构是指网络中节点和通信链路的几何排列方式,常见的网络拓扑结构包括总线型、星型、环型、树型和...
继承与发展苏轼豪放词风的词人故... 继承和发展苏轼开创的豪放词派的主要有辛弃疾、陈亮、刘过等人。其中,辛弃疾是这一词风的最杰出代表。他将...
英国多所大学或将放弃期刊打包协... 在英国高校普遍面临财政紧缩的背景下,多家国际学术出版商却仍提出了维持价格涨幅的报价方案,引发大学图书...
教育部公布!四川3所高校获推免... 近日,教育部公布 《关于对新增推免资格高校予以备案的通知》 对北京电子科技学院等67所 新增推免资格...