訊飛星火高考數(shù)學(xué)成績(jī)穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì),深度推理大模型引領(lǐng)教育創(chuàng)新

2025年高考數(shù)學(xué)結(jié)束后,關(guān)于數(shù)學(xué)考試難度的話題迅速引爆了熱搜。

訊飛星火高考數(shù)學(xué)成績(jī)穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì),深度推理大模型引領(lǐng)教育創(chuàng)新

于此同時(shí),一場(chǎng)人類考生與AI的數(shù)學(xué)較量也引發(fā)廣泛關(guān)注。DeepSeek R1 0528、訊飛星火 X1-0420、GPT o3 等國(guó)內(nèi)外主流深度推理大模型化身 “AI 考生”,在高考數(shù)學(xué)卷上展開(kāi)激烈角逐。其中,訊飛星火X1以141分的優(yōu)異成績(jī)脫穎而出,穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì)。

本次評(píng)測(cè)由IT之家發(fā)起,采用了多版本交叉驗(yàn)證結(jié)合老師解題驗(yàn)證的方式,總分設(shè)定為150分,并特別邀請(qǐng)了具有十年高中數(shù)學(xué)一線教研經(jīng)驗(yàn)的專家輔助評(píng)分。參與評(píng)測(cè)的深度推理大模型共有七家,包括訊飛星火X1-0420、DeepSeek R1 0528、通義千問(wèn)Qwen3-235B-A22B、豆包 Seed-Thingking-v1.5、文心X1 Turbo、騰訊混元Hunyuan T1 latest以及GPT o3。

在考試開(kāi)始時(shí),面對(duì)較為基礎(chǔ)的選擇題,各家大模型均有不錯(cuò)的表現(xiàn)。

訊飛星火高考數(shù)學(xué)成績(jī)穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì),深度推理大模型引領(lǐng)教育創(chuàng)新

然而,隨著題目難度的不斷上升,模型間的差異開(kāi)始顯現(xiàn)。比如在面對(duì)一道對(duì)數(shù)函數(shù)題時(shí),DeepSeek都出現(xiàn)了錯(cuò)誤。而到了解答題環(huán)節(jié),各家比分開(kāi)始進(jìn)一步拉開(kāi)差距。

根據(jù)測(cè)評(píng)的最終結(jié)果,本次參與測(cè)評(píng)的大模型大多達(dá)到了人類優(yōu)秀考生的水準(zhǔn),相較去年有較大提升。其中,DeepSeek和訊飛星火X1表現(xiàn)突出,是唯二突破140分的大模型;豆包、通義千問(wèn)、元寶等國(guó)產(chǎn)大模型分?jǐn)?shù)則緊跟第三名GPT o3,接近國(guó)際頂尖的模型水平。

據(jù)悉,訊飛星火X1作為第一梯隊(duì)的深度推理大模型,其版本相較于其他模型較早,同時(shí)模型量級(jí)也相對(duì)較小(70B)。但是在測(cè)評(píng)中,訊飛星火X1卻展現(xiàn)出強(qiáng)大的推理能力。特別在解答題環(huán)節(jié),訊飛星火都能夠給出正確的答案和清晰明了的解題過(guò)程,并多次獲得滿分,其表現(xiàn)令人印象深刻。

訊飛星火高考數(shù)學(xué)成績(jī)穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì),深度推理大模型引領(lǐng)教育創(chuàng)新

值得一提的是,基于在教育領(lǐng)域深耕20多年的經(jīng)驗(yàn),訊飛星火X1在其他學(xué)科的測(cè)試中表現(xiàn)同樣亮眼。比如在微博#AI高考作文盲評(píng)挑戰(zhàn)#中,訊飛星火X1成功拔得頭籌;在英語(yǔ)作文方面,訊飛星火X1同樣在新京報(bào)的測(cè)評(píng)中奪得第一,展現(xiàn)出強(qiáng)大的語(yǔ)言能力。

隨著AI技術(shù)的不斷發(fā)展,深度推理大模型在教育領(lǐng)域的應(yīng)用前景越來(lái)越廣闊。訊飛星火作為其中的佼佼者,不僅為學(xué)生提供了有力的學(xué)習(xí)支持,更為教育行業(yè)的創(chuàng)新升級(jí)注入了新的活力。未來(lái),我們有理由相信,訊飛星火將繼續(xù)引領(lǐng)教育創(chuàng)新,為培養(yǎng)更多優(yōu)秀人才貢獻(xiàn)力量。

本文轉(zhuǎn)載自:,不代表科技訊之立場(chǎng)。原文鏈接:http://news.cnmtpt.com/?Sid=12177468_BJ130W644462775

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論