訊飛星火深度推理大模型X1升級版來了！數(shù)學(xué)能力和DeepSeek R1誰強(qiáng)？

陳晨 ? 2025年3月8日 12:54:23 ? 產(chǎn)經(jīng)

3月3日，科大訊飛發(fā)布了深度推理大模型星火X1（以下簡稱星火X1）再升級，在模型參數(shù)量比業(yè)界同行少一個數(shù)量級的情況下，數(shù)學(xué)能力全面對標(biāo)DeepSeek R1和OpenAI o1，在中文數(shù)學(xué)各項任務(wù)中均實現(xiàn)領(lǐng)先，同時聯(lián)合華為重磅升級星火一體機(jī)，融合訊飛星火與DeepSeek雙引擎能力。

同樣是國內(nèi)當(dāng)前最強(qiáng)，也是最受關(guān)注的兩款深度推理大模型，星火X1和DeepSeek R1的數(shù)學(xué)能力究竟誰強(qiáng)誰弱？今天我們做一個簡單PK。試題類型包括初、高應(yīng)用題、推理題及奧數(shù)等，共5題，每題20分，滿分100，最后以得分多者為勝。

這里之所以沒有將深度推理大模型引以自豪的類人思考過程納入計分項，是因為深度大模型是否正確思考，將直接影響答題結(jié)果，無需畫蛇添足，再單評測。

題目1：假設(shè)有一個池塘，里面有無窮多的水?，F(xiàn)有2個空水壺，容積分別為5升和6升。如何只用這2個水壺從池塘里取得3升的水。

星火X1給出的答案：

訊飛星火深度推理大模型X1升級版來了！數(shù)學(xué)能力和DeepSeek R1誰強(qiáng)？

DeepSeek給出的答案：

兩大模型都給出了正確答案，但相比之下，訊飛星火的解題步驟更簡單、明了，易于理解。該題兩大模型均得20分。

題目2：某服裝店的老板在武漢看中一種夏季襯衫，就用8000元購進(jìn)若干件，以每件58元的價格出售，很快售完，又用了17600元同樣襯衫，數(shù)量是第一次的2倍，每件進(jìn)價比第一次多了4元，服裝店仍然按每件58元出售全部售完，問該服裝店這筆生意的盈利情況如何？

星火X1給出的答案：

DeepSeek給出的答案：

兩大模型再次全體答對，各得20分。

題目3：

星火X1給出的答案：

DeepSeek給出的答案：

該題牽涉到圖形、函數(shù)等，手工輸入困難，因此我們采用了拍照上傳，讓兩大模型識圖解答的方式，令人欣慰的是兩大模型都支持識圖解題，并且識別結(jié)果相當(dāng)準(zhǔn)確，這對于用戶來說無疑是一大福音，畢竟對于數(shù)學(xué)來說，據(jù)圖解題是常態(tài)。

答案方面，兩大模型再次不負(fù)眾望，都給出了正確答案，各得20分。相較之下，星火X1的解題過程再次表現(xiàn)出了邏輯清晰、易于理解的特點。

題目5：有100根火柴，甲、乙兩人輪流取火柴，規(guī)定每次取的根數(shù)不得超過10根，也不能不取。規(guī)定誰取到最后一根火柴誰就獲勝。如果兩人都采用最佳方法，甲先取，那么誰將獲得勝利？

星火X1給出的答案：

DeepSeek給出的答案

對于這道典型的奧數(shù)問題，兩大模型均準(zhǔn)確找出了破題點，并給出了準(zhǔn)確答案，各得20分。

小結(jié)：

從以上簡單測試來看，訊飛星火深度推理大模型X1升級版和DeepSeek R1的數(shù)學(xué)能力都令人嘆服，二者表現(xiàn)旗鼓相當(dāng)，均以滿分交卷。只是從解題過程看，星火X1給出的要更簡潔、更明晰。

和過去人們熟知的大語言模型相比，深度推理模型的最大特點是強(qiáng)化了模型在邏輯推理、因果推斷以及結(jié)構(gòu)化知識應(yīng)用方面的能力，尤其在數(shù)學(xué)問題、代碼生成以及科學(xué)推理等方面更具優(yōu)勢。

星火X1能類人思考，在生成回答時更強(qiáng)調(diào)邏輯和推理，并能給出縝密清晰的思考路徑，自動糾錯，大大地減少了過去大模型“已讀亂回”的現(xiàn)象，可廣泛的用于教育、醫(yī)療乃至科研等領(lǐng)域。

正是基于深度推理大模型的這一特點,科大訊飛在發(fā)布訊飛星火深度推理大模型X1升級版的同時，首發(fā)星火醫(yī)療大模型X1，并推出醫(yī)療、高教、政務(wù)、警務(wù)、法律五大全新應(yīng)用場景一體機(jī)，同時正式發(fā)布“星火X1+DeepSeek”雙引擎AI學(xué)習(xí)機(jī)，進(jìn)一步賦能醫(yī)療、教育、智慧城市等領(lǐng)域。

本文轉(zhuǎn)載自：，不代表科技訊之立場。原文鏈接：http://news.cnmtpt.com/?Sid=11514009_M8240279472

陳晨管理團(tuán)隊

0 0

孤勇者白象：把“圍獵”變成“趕考”

這幾年，從蜜雪冰城到泡泡瑪特，從胖東來到白象食品，河南的消費(fèi)品品牌不斷成為商界和社會關(guān)注的亮點。亮點往往也連著熱點。前不久，當(dāng)于東來面對“柴懟懟”對胖東來玉石銷售的無端中傷時，他…

陳晨
產(chǎn)經(jīng) 14小時前
創(chuàng)維光伏E企贏開啟企業(yè)用電0成本時代，引領(lǐng)全民光伏普惠變革

在全球能源轉(zhuǎn)型的關(guān)鍵節(jié)點，中國工業(yè)企業(yè)正面臨著能源成本攀升與綠色轉(zhuǎn)型的雙重挑戰(zhàn)。隨著《中華人民共和國能源法》的正式通過，國家明確支持優(yōu)先開發(fā)利用可再生能源，提高非化石能源消費(fèi)比重，…

陳晨
產(chǎn)經(jīng) 16小時前
產(chǎn)經(jīng)

微信再上新鴻蒙生態(tài)展現(xiàn)加速迭代強(qiáng)勁動力

國民軟件微信在鴻蒙系統(tǒng)中再迎重磅更新，切實關(guān)切用戶呼聲。 6月6日，根據(jù)華為官方消息，鴻蒙版微信升級到了1.0.7.35版本，需要指出的是，此次升級后的版本著重對于用戶需求強(qiáng)烈、使…

陳晨
17小時前
產(chǎn)經(jīng)

全國愛眼日天馬在行動：五大維度定義護(hù)眼“好屏”新標(biāo)準(zhǔn)

數(shù)字時代，智能顯示設(shè)備深度嵌入大眾生活，成為不可或缺的“體外器官”。據(jù)Ipsos調(diào)研數(shù)據(jù)，2024年全球人均手機(jī)使用時長高達(dá)4小時，預(yù)計2050年全球近視人數(shù)占比超過50%。過度用…

陳晨
22小時前
產(chǎn)經(jīng)

沐光發(fā)布全屋健康智能燈光系統(tǒng)，兩大技術(shù)革新開啟健康照明 2.0 時代

近日，亞洲權(quán)威頂級設(shè)計盛會—“設(shè)計上海2025”落下帷幕，來自30多個國家及地區(qū)的600余品牌的設(shè)計精品，呈現(xiàn)前沿的設(shè)計理念。吸引超8萬名專業(yè)觀眾，到場親身感受設(shè)計的魅力。專注健康…

陳晨
1天前
產(chǎn)經(jīng)

高考Agent來了，華為瀏覽器高考頻道上新

在今年高考季，小藝協(xié)同華為瀏覽器推出高考Agent問答服務(wù)。華為瀏覽器作為終端設(shè)備上全球資訊的便捷入口，在權(quán)威資訊的基礎(chǔ)上，基于AI Agent能力，在高考日程、院校信息、歷年真題…

陳晨
1天前
產(chǎn)經(jīng)

全新高考Agent問答服務(wù)！華為瀏覽器小藝高考通上線

在今年高考季，小藝協(xié)同華為瀏覽器推出高考Agent問答服務(wù)。華為瀏覽器作為終端設(shè)備上全球資訊的便捷入口，在權(quán)威資訊的基礎(chǔ)上，基于AI Agent能力，在高考日程、院校信息、歷年真題…

陳晨
1天前
產(chǎn)經(jīng)

從“臨時搭子”到“長期閨蜜”：酷開AI閨蜜機(jī)重新定義智能生活

在快節(jié)奏的都市生活中，年輕人正經(jīng)歷著一場微妙的消費(fèi)觀革命。當(dāng)“斷舍離”的極簡主義撞上“智能焦慮”的信息洪流，人們開始厭倦那些“一次性工具”般的科技產(chǎn)品，轉(zhuǎn)而尋找能真正融入生活、實現(xiàn)…

陳晨
1天前
產(chǎn)經(jīng)

全國愛眼日天馬在行動：五大維度定義護(hù)眼“好屏”新標(biāo)準(zhǔn)

數(shù)字時代，智能顯示設(shè)備深度嵌入大眾生活，成為不可或缺的“體外器官”。據(jù)Ipsos調(diào)研數(shù)據(jù)，2024年全球人均手機(jī)使用時長高達(dá)4小時，預(yù)計2050年全球近視人數(shù)占比超過50%。過度用…

陳晨
1天前
產(chǎn)經(jīng)

第30個全國愛眼日易視界聯(lián)合河南廣播電視臺發(fā)起愛眼公益活動

2025年6月6日，在第30個全國愛眼日來臨之際，易視界聯(lián)合河南廣播電視臺都市生活事業(yè)部，特別策劃了一場溫暖且實用的“關(guān)注普遍的眼健康”公益活動。活動現(xiàn)場，易視界專業(yè)團(tuán)隊為市民提…

陳晨
1天前
產(chǎn)經(jīng)

百年奢品家電ASKO閃耀“設(shè)計上海”2025 探尋可持續(xù)奢居未來

6月4日–7日，“設(shè)計上海”2025在上海世博展覽館盛大開幕，匯聚全球頂尖設(shè)計師與品牌，共同探討未來設(shè)計的無限可能。在這場匯聚全球設(shè)計智慧的盛宴中，百年奢品家電ASKO…

陳晨
1天前
136萬人圍觀董明珠淘寶直播首秀新中式空調(diào)、琺瑯鍋爆火出圈

6月5日晚，136萬人在線圍觀董明珠淘寶直播首秀，新中式空調(diào)、琺瑯鍋、鮮花冰箱等多款格力產(chǎn)品爆火出圈。在探店“董明珠健康家”直播中，董明珠力推國風(fēng)山水系列空調(diào)，并親自用絲巾演示“…

陳晨
產(chǎn)經(jīng) 2天前
產(chǎn)經(jīng)

“煥”醒亮度，“包”您滿意！愛普生家用投影機(jī)換燈服務(wù)包全新上線

在這個視覺至上的時代，您的“家庭影院“是否還能呈現(xiàn)多年前如初的震撼畫質(zhì)？愛普生深諳用戶的品質(zhì)需求，全新推出家用燈泡型號投影機(jī)換燈服務(wù)包，并于2025年4月正式入駐愛普生家用投影小助…

陳晨
2天前
第五屆平潭IM兩岸青年影展聯(lián)合即夢AI發(fā)起“AIGC單元”

近日，第五屆平潭IM兩岸青年影展宣布首設(shè)“AIGC單元”，由即夢AI聯(lián)合發(fā)起，面向全球華人青年創(chuàng)作者征集AI短片作品，以“未來已來”為主題探索科技與影像藝術(shù)的融合可能。 IM兩岸青…

陳晨
產(chǎn)經(jīng) 2天前
百度智能云發(fā)布千帆慧金金融大模型

6月6日,在人民日報文化傳媒有限公司和百度聯(lián)合主辦的2025智能經(jīng)濟(jì)論壇上,百度智能云發(fā)布千帆慧金金融大模型。針對金融行業(yè)應(yīng)用中的專業(yè)需求,該模型基于海量金融語料深度訓(xùn)練,構(gòu)建金融…

陳晨
產(chǎn)經(jīng) 2天前
產(chǎn)經(jīng)

2025世俱杯正確打開方式！海信100吋大屏賣爆：客廳秒變現(xiàn)場

　　2025世俱杯馬上進(jìn)入倒計時，全世界球迷的心將再度沸騰。誰不想去現(xiàn)場零距離體驗獨屬于足球的激情？雖然廣大球迷只能蹲守直播，但有了海信100吋大屏助力，客廳也能變球場！　　剛過…

科技探索者
2天前
產(chǎn)經(jīng)

科大訊飛“聽見AI的聲音”6周年，和萬茜一起關(guān)注聽障群體，聽見更大的世界

6月6日，科大訊飛“聽見AI的聲音”關(guān)愛聽障人士公益行動正式迎來六周年。今年，訊飛聽見與中國聾人協(xié)會、中國殘疾人藝術(shù)團(tuán)、演員萬茜繼續(xù)攜手，攜手呼吁大家關(guān)注聽障群體。由科大訊飛聯(lián)合…

陳晨
2天前
產(chǎn)經(jīng)

科技照亮銀發(fā)生活創(chuàng)新編織幸福晚年

在老齡化浪潮日益洶涌的今天,如何為銀發(fā)一族構(gòu)筑一個安心、愜意、便利的居住天地,已成為全社會共同矚目的課題。富德生命人壽,以“美好生活”居家養(yǎng)老服務(wù)為突破口,憑借產(chǎn)品的科技賦能與創(chuàng)新…

陳晨
2天前
產(chǎn)經(jīng)

高效應(yīng)對考試三星Galaxy Tab S10系列做你的AI學(xué)習(xí)搭檔

高考季如約而至，考場內(nèi)學(xué)子們奮筆疾書，場外的人們也對這場年度大考保持熱烈關(guān)注。尤其是那些目前仍處于備戰(zhàn)階段的高二學(xué)生，一年后他們也將奮戰(zhàn)在沖刺的戰(zhàn)場上，如何在接下來的階段提升成績成…

陳晨
2天前
產(chǎn)經(jīng)

聯(lián)合國KIP國際學(xué)院主席法比亞諾先生一行參訪沃民高科,共探中醫(yī)AI融合創(chuàng)新

5月29日下午,聯(lián)合國KIP國際學(xué)院主席、意大利前外交部副部長法比亞諾先生一行到訪沃民高新科技(北京)股份有限公司及旗下子公司北京心扁鵲連鎖運(yùn)營管理有限公司。在公司董事長齊中祥及海…

陳晨
2天前