豆包1.6 “不偏科” ,高考成绩直逼“清北”
开心田螺
2025-06-28 22:58:37
0

文科成绩683分,理科648分。

近日,豆包Seed1.6-Thinking模型测试了2025高考全科,交出一份成绩优异的答卷。该测试采用全国新一卷和山东省自主命题。

豆包多项考试成绩优异,高考成绩直逼“清北”

随着高考的结束,AI大模型也开启了一轮“竞技”。

2025年高考测试结果显示,豆包的语文、英语、物理、历史、地理、政治六门学科获最高分,数学成绩也超过140分;DeepSeek R1获得数学最高分145分;Gemini 2.5 Pro以82分获得化学最高分,并与OpenAI o3一起获得生物最高分,成绩为77分。

这样的成绩是什么水平?《半岛都市报》专门咨询了省内多位有着多年高三带班经验的资深教师:本次除化学成绩相对稍低外,预估豆包大模型1.6的其余科目组合的赋分成绩最高能超过690分,具备冲击“清北”的水平。

“因为根据过往经验判断,3门自选科目的赋分相比原始分会有一定程度的提高,尤其是在化学、物理等难度较大的科目上。”上述资深老师表示。

6月25日,山东高考公布一分一段表,690分排名全省前80左右。清华北大在山东的招生人数超过150名,这意味着豆包Seed1.6-Thinking模型测试成绩超过“清北”录取线。

在另一项国际测试中,豆包成绩依然拔得头筹。JEE Advanced是印度理工学院的第二阶段入学考试,每年数百万人参加第一阶段考试,其中前25万进入第二阶段考试。考试分两场,每场3小时,同时考查数学、物理、化学三科。

对比全印度人考生,第一名为332分,第10名为317分,Gemini-2.5-Pro 和 Seed1.6-Thinking 可取得全印度top 10的成绩。Gemini-2.5-Pro 物理/化学表现出色,Seed1.6-Thinking 在5次采样的数学测试中回答全部正确。

豆包不“偏科”,推理效果和性能更加平衡

细心的网友可能看到,豆包理科成绩怎么比文科差几十分?AI大模型是不是偏科呀?

Seed团队表示,首次测试时使用的网络版考卷清晰度较低,各大模型在化学、生物两门非常依赖图像的考试中丢分较多。该团队在获得更高清版本的高考试题图片后,采用图文交织的方式对化学和生物重新进行测试,发现豆包模型在这两科上能够提升近30分,理科总成绩可达到676分,验证了全模态推理可以更大程度激发模型的潜力。

这不但证明了豆包Seed1.6-Thinking模型并不偏科,同时也具备了较好的视觉推理能力。也说明结合文本和图片进行全模态推理可以更大程度激发模型的潜力,相信这也是未来值得投入的研究方向。

另外,Seed团队还提出了“动态思考能力”(AutoCoT),提供全思考、不思考、自适应思考三种推理模式,在保证效果的同时大幅压缩了CoT长度。为了实现动态思考能力,团队在RL训练中引入新的奖励函数——惩罚过度思考、奖励恰当思考。

“Seed1.6系列模型是Seed团队在推理效果和性能平衡上的一次较好尝试,同时模型从预训练到后训练融合了VLM多模态能力。”Seed团队表示。

AI在高考领域展现出的潜力引发关注,6月19日,清华大学沈阳教授团队发布的《AI赋能教育:高考志愿填报工具使用指南》分析了志愿填报中的常见误区与AI解决方案。其中,“唯分数论,忽视位次”“唯热门论,忽视发展性”“忽视地域因素影响”等,都可以通过AI功能有效规避和辅助决策。

豆包大模型Seed1.6是字节跳动Seed团队推出的最新通用模型系列,融合了多模态能力,支持自适应的深度思考、多模态理解、图形界面操作,且支持256K长上下文的深度推理。目前,Seed1.6系列已通过火山引擎对外开放API调用。

文/张帅

相关内容

3000元“准大学生夏令营...
高考刚刚结束,“下一赛道”已悄然展开。近日,有网友在社交平台发帖,...
2025-06-29 02:09:04
2025秋季统编版语文教科...
2025 秋季语文教材变化 2025教材变革 近期,有关2025年...
2025-06-29 01:54:05
特级教师回母校做讲座,江苏...
扬子晚报网6月28日(通讯员 张明平 冯潇祎 记者 姜天圣)日前,...
2025-06-29 01:12:25
明日,海南高考志愿填报开启...
2025年海南省普通高校招生本科提前普通类、体育类(定向公费培养师...
2025-06-29 01:11:38
围观!启航名师讲25高考真...
高中教师的实力,要看备战高考的能力,而权威解析高考真题是关键! 这...
2025-06-29 00:53:39
花5499元报96个志愿全...
▲资料图:高考志愿填报也是对考生和家长的考验。图/IC photo...
2025-06-29 00:50:56
在千万人瞩目下完成高考补考...
当千万人在屏幕前刷新,只为捕捉那决定命运的分数数字时,山东少年姜昭...
2025-06-29 00:50:19
提质增速注入新动能 加快培...
在加快培育发展新质生产力、全力推动经济高质量发展的大背景下,高等职...
2025-06-29 00:34:53
想让孩子变勤快,唯一的秘诀...
邻居家儿子皓皓特别勤快,看着自家懒惰的儿子,忍不住向邻居请教经验。...
2025-06-29 00:19:29

热门资讯

科技解密(白金岛放炮罚开挂辅助... 有 亲,根据资深记者爆料白金岛放炮罚是可以开挂的,确实有挂(咨询软件无需...
玩家推荐(全民如意棋牌有没有挂... 有 亲,根据资深记者爆料全民如意棋牌是可以开挂的,确实有挂(咨询软件无需...
3000元“准大学生夏令营”走... 高考刚刚结束,“下一赛道”已悄然展开。近日,有网友在社交平台发帖,河北廊坊街头一块培训广告牌因一句“...
今日资讯(算番宝典究竟有挂吗)... 有 亲,根据资深记者爆料算番宝典是可以开挂的,确实有挂(咨询软件无需打开...
玩家推荐(新版九哥牛牛怎么装挂... 有 亲,根据资深记者爆料新版九哥牛牛是可以开挂的,确实有挂(咨询软件无需...
玩家推荐(万圣节消除大作战究竟... 有 亲,根据资深记者爆料万圣节消除大作战是可以开挂的,确实有挂(咨询软件...
独家推荐(樱花炸金花开挂神器)... 有 亲,根据资深记者爆料樱花炸金花是可以开挂的,确实有挂(咨询软件无需打...
科技热点(白虎炸金花怎么装挂)... 有 亲,根据资深记者爆料白虎炸金花是可以开挂的,确实有挂(咨询软件无需打...
科技热点(快乐竞技开挂辅助神器... 有 亲,根据资深记者爆料快乐竞技是可以开挂的,确实有挂(咨询软件无需打开...
独家分享(夜猫麻将辅助软件)√... 有 亲,根据资深记者爆料夜猫麻将是可以开挂的,确实有挂(咨询软件无需打开...