DeepSeek推出NSA：超快速長(zhǎng)上下文訓(xùn)練與推理的新利器

AI ? 2025年2月18日 17:51:00 ? AI

今日，人工智能領(lǐng)域的創(chuàng)新企業(yè)DeepSeek宣布正式推出NSA（Native Sparse Attention）機(jī)制。這一機(jī)制專為超快速長(zhǎng)上下文訓(xùn)練與推理而設(shè)計(jì)，旨在通過(guò)硬件對(duì)齊和原生可訓(xùn)練的稀疏注意力機(jī)制，為用戶帶來(lái)前所未有的體驗(yàn)。

NSA的核心組件包括動(dòng)態(tài)分層稀疏策略、粗粒度token壓縮以及細(xì)粒度token選擇。這些組件共同協(xié)作，使得NSA能夠在優(yōu)化現(xiàn)代硬件設(shè)計(jì)的同時(shí)，實(shí)現(xiàn)推理加速和預(yù)訓(xùn)練成本的降低，而且這一切都是在不犧牲性能的前提下完成的。

DeepSeek官方表示，NSA機(jī)制在通用基準(zhǔn)、長(zhǎng)上下文任務(wù)和基于指令的推理上，其表現(xiàn)與全注意力模型相當(dāng)甚至更加優(yōu)秀。這意味著，用戶在享受更快推理速度和更低成本的同時(shí)，也能獲得與頂尖模型相媲美的性能表現(xiàn)。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/706746.html

DeepSeek NSADeepSeek

AI認(rèn)證作者

0 0

AI

DeepSeek R1模型已完成小版本試升級(jí)：”深度思考”功能優(yōu)化提升

近日，人工智能領(lǐng)域DeepSeek R1模型已完成小版本試升級(jí)，用戶可通過(guò)官方網(wǎng)頁(yè)、移動(dòng)APP及微信小程序即刻體驗(yàn)新版本，同時(shí)API接口與調(diào)用方式保持完全兼容。此次升級(jí)延續(xù)了該團(tuán)隊(duì)…

AI
4天前
新聞

Skyvast助力海外中國(guó)云引發(fā)馬來(lái)西亞成中美AI博弈新戰(zhàn)場(chǎng)

當(dāng)?shù)貢r(shí)間5月19日，馬來(lái)西亞原計(jì)劃部署華為昇騰GPU驅(qū)動(dòng)的AI服務(wù)器，并引入中國(guó)初創(chuàng)公司DeepSeek的大語(yǔ)言模型（LLM）。然而，項(xiàng)目公布僅24小時(shí)后即被撤回，表面未作解釋的背…

NEWS
2025年5月22日
新聞

工信部談Deepseek等大模型“出圈”

在4月18日國(guó)新辦發(fā)布會(huì)上，工業(yè)和信息化部總工程師謝少鋒為國(guó)產(chǎn)大模型”點(diǎn)贊”。在介紹2025年一季度發(fā)展成果時(shí)，他特別提及以DeepSeek為代表的國(guó)產(chǎn)大?！?/p>

AI
2025年4月19日
新聞

黃仁勛受邀訪華再表態(tài) 英偉達(dá)承諾“優(yōu)化合規(guī)芯片”服務(wù)40年老客戶

4月17日晚，英偉達(dá)CEO黃仁勛應(yīng)中國(guó)貿(mào)促會(huì)邀請(qǐng)抵達(dá)北京，引發(fā)全球科技界關(guān)注。據(jù)媒體報(bào)道，英偉達(dá)官方回應(yīng)稱“公司定期與各國(guó)政府討論產(chǎn)品技術(shù)”，并確認(rèn)黃仁勛此行已與中國(guó)貿(mào)促會(huì)會(huì)長(zhǎng)任鴻…

NEWS
2025年4月18日
新聞

曝黃仁勛會(huì)見(jiàn)DeepSeek創(chuàng)始人梁文鋒

昨日，英偉達(dá)CEO黃仁勛現(xiàn)身北京引發(fā)全球科技界關(guān)注。據(jù)英國(guó)《金融時(shí)報(bào)》披露，此行黃仁勛會(huì)見(jiàn)DeepSeek創(chuàng)始人梁文鋒，雙方重點(diǎn)討論“為中國(guó)市場(chǎng)設(shè)計(jì)下一代合規(guī)芯片”的技術(shù)方案。這是…

秋秋
2025年4月18日
AI

?微信聊天框新增AI助手：騰訊元寶一鍵解析文章圖片

昨日，微信“元寶紅包封面助手”正式更名為“元寶”，標(biāo)志著騰訊旗下AI產(chǎn)品APP元寶在微信聊天界面全面打通入口。用戶現(xiàn)可通過(guò)添加“元寶”為好友，直接在聊天框內(nèi)激活其AI服務(wù)，實(shí)現(xiàn)文檔…

net
2025年4月17日
新聞

ChatGPT全球下載量破紀(jì)錄 OpenAI官宣開(kāi)源新戰(zhàn)略

在TED 2025全球大會(huì)上，OpenAI CEO薩姆·奧爾特曼首次正面回應(yīng)中國(guó)AI企業(yè)競(jìng)爭(zhēng)，稱“DeepSeek的崛起并未影響GPT產(chǎn)品線增長(zhǎng)”。其現(xiàn)場(chǎng)披露重大戰(zhàn)略調(diào)整：公司將在…

若安丶
2025年4月14日
新聞

DeepSeek等多款A(yù)I工具集體“宕機(jī)” 用戶直呼崩潰

剛剛，國(guó)內(nèi)知名AI工具DeepSeek及同類產(chǎn)品Kimi、豆包等突然出現(xiàn)服務(wù)中斷，引發(fā)大量用戶討論。截至發(fā)稿，“#deepseek崩了#”話題已登上微博熱搜，用戶集中反映無(wú)法正常使…

AI
2025年4月8日
AI

DeepSeek首超ChatGPT：月訪問(wèn)量破5億登全球增速榜首

近日，AI分析平臺(tái)aitools.xyz發(fā)布報(bào)告顯示，中國(guó)人工智能企業(yè)深度求索（DeepSeek）的月新增網(wǎng)站訪問(wèn)量首次超越OpenAI旗下ChatGPT，成為全球增長(zhǎng)最快的AI工…

AI
2025年4月1日
AI

?DeepSeek V3模型更新：編程能力飆升，商業(yè)使用更自由

近日，國(guó)產(chǎn)AI公司深度求索（DeepSeek）宣布推出大模型V3版本更新，其6850億參數(shù)的開(kāi)源版本已同步上線開(kāi)源平臺(tái)。官方稱此次為“小版本升級(jí)”，用戶可通過(guò)官網(wǎng)、App及小程序入…

AI
2025年3月25日
AI

全球首個(gè)“減肥AI助手”在國(guó)內(nèi)發(fā)布，基于DeepSeek、OpenAI及豆包三大通用模型

6月23日，全球首款專攻體重管理的AI大模型?“減單”?在合肥正式亮相。該模型由安徽醫(yī)科大學(xué)校長(zhǎng)翁建平教授團(tuán)隊(duì)聯(lián)合?中國(guó)科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院?、?浙江諾特健康科技公司?共同研發(fā)…

AI
2025年3月24日
新聞

海信星海大模型+DeepSeek 開(kāi)啟智慧新風(fēng)新時(shí)代！

3月21日，海信集團(tuán)在上海召開(kāi)“此刻是我”發(fā)布會(huì)，海信集團(tuán)副總裁、海信家電集團(tuán)總裁胡劍涌隆重推出“海信家電AI全場(chǎng)景技術(shù)方案”和“AI空氣管家智能體”，并正式發(fā)布行業(yè)首款不擴(kuò)孔同時(shí)吸排風(fēng)雙向新風(fēng)空調(diào)X7Pro，以及2025 FIFA世俱杯?全球官方空調(diào)——璀璨C3Pro及X3Pro，開(kāi)啟“AI新風(fēng)”空調(diào)時(shí)代。

潮玩君
2025年3月22日
新聞

黃仁勛再談DeepSeek：新型AI對(duì)算力的渴求只會(huì)更強(qiáng)

在英偉達(dá)年度技術(shù)盛會(huì)GTC 2025大會(huì)上，黃仁勛再談DeepSeek。公司創(chuàng)始人兼CEO黃仁勛在主題演講中直面行業(yè)爭(zhēng)議，針對(duì)近期科技圈熱議的”DeekSeek公司R1…

野游栗
2025年3月20日
新聞

騰訊云上海峰會(huì)：系統(tǒng)闡釋AI戰(zhàn)略，多模方案已落地30余行業(yè)

3月19日，2025騰訊全球數(shù)字生態(tài)大會(huì)上海峰會(huì)開(kāi)幕。大會(huì)以“智啟新機(jī) 云驅(qū)增長(zhǎng)”為主題，匯聚上海多家企業(yè)科技創(chuàng)新領(lǐng)軍人物，共議AI驅(qū)動(dòng)下的產(chǎn)業(yè)增長(zhǎng)新突破。

科技探索者
2025年3月19日
AI

快手可靈AI宣布全面接入DeepSeek-R1，一句話就能生成專業(yè)級(jí)視頻

快手旗下AI創(chuàng)意平臺(tái)可靈AI宣布全面接入深度求索（DeepSeek）公司的大模型DeepSeek-R1，進(jìn)一步優(yōu)化視頻、圖片生成的智能提示詞功能。用戶通過(guò)輸入簡(jiǎn)單靈感描述，即可由A…

AI
2025年3月18日
AI

OpenAI向美政府緊急提交指控信，”狙擊”中國(guó)AI新貴

美國(guó)當(dāng)?shù)貢r(shí)間3月15日，人工智能領(lǐng)域領(lǐng)軍企業(yè)OpenAI向美國(guó)政府提交正式信函，矛頭直指中國(guó)AI公司深度求索（DeepSeek）。這份長(zhǎng)達(dá)15頁(yè)的文件引發(fā)業(yè)界震動(dòng)，揭示出全球人工智…

AI
2025年3月17日
AI

AI大模型平臺(tái)排行榜震撼發(fā)布，誰(shuí)才是你的NO.1

隨著人工智能技術(shù)的迅猛發(fā)展，大模型平臺(tái)在AI領(lǐng)域的重要性日益凸顯。2025年2月發(fā)布的“中國(guó)AI大模型平臺(tái)排行榜”顯示了當(dāng)前各大模型平臺(tái)的綜合實(shí)力、初創(chuàng)潛力以及在不同應(yīng)用場(chǎng)景下的表…

AI
2025年3月12日
AI

DeepSeek 官方：“R2 將在 3 月 17 日發(fā)布”為假消息

DeepSeek官方回應(yīng)稱R2假消息，公司正在加速推出其R2人工智能模型，有望生成更好的代碼并支持英語(yǔ)以外的語(yǔ)言推理。

科技探索者
2025年3月12日
新聞

消息稱歐洲三大銀行搶測(cè)中國(guó)AI模型DeepSeek

據(jù)外媒The Information報(bào)道，自2024年1月起，歐洲多家頂級(jí)銀行正秘密測(cè)試中國(guó)AI公司深度求索（DeepSeek）的生成式人工智能模型，試圖挖掘其技術(shù)潛力。這與美國(guó)銀…

AI
2025年3月12日
商業(yè)

華爾街改口！全球熱錢正瘋狂搶購(gòu)中國(guó)科技股

高盛發(fā)布最新報(bào)告揭示全球資金流向巨變：MSCI中國(guó)指數(shù)開(kāi)年飆升20%，創(chuàng)下該指數(shù)創(chuàng)立以來(lái)最強(qiáng)開(kāi)年表現(xiàn)，香港恒生科技指數(shù)更以32%的年度漲幅領(lǐng)跑全球。數(shù)據(jù)顯示，阿里巴巴、騰訊、百度年…

商業(yè)頭條
2025年3月11日

發(fā)表回復(fù)

登錄后才能評(píng)論

DeepSeek推出NSA：超快速長(zhǎng)上下文訓(xùn)練與推理的新利器

相關(guān)推薦

發(fā)表回復(fù)