英偉達(dá)發(fā)布Eagle 2.5視覺(jué)語(yǔ)言模型：8B參數(shù)單挑GPT-4o

AI ? 2025年4月23日 16:54:00 ? AI

英偉達(dá)于近日發(fā)布全新視覺(jué)語(yǔ)言模型Eagle 2.5，這款僅8B參數(shù)的AI在長(zhǎng)視頻理解領(lǐng)域?qū)崿F(xiàn)突破。該模型在Video-MME基準(zhǔn)測(cè)試（512幀輸入）中斬獲72.4%準(zhǔn)確率，性能直指Qwen2.5-VL-72B等大參數(shù)量級(jí)競(jìng)品。

Eagle 2.5的核心突破源自?xún)身?xiàng)創(chuàng)新技術(shù)：信息優(yōu)先采樣通過(guò)圖像區(qū)域保留技術(shù)，將原始圖像有效信息保留率提升至60%以上，同時(shí)自動(dòng)降級(jí)采樣系統(tǒng)能根據(jù)上下文動(dòng)態(tài)平衡圖文輸入比例。漸進(jìn)式后訓(xùn)練策略使模型逐步適應(yīng)從32K到128K的上下文窗口擴(kuò)展，避免過(guò)擬合特定數(shù)據(jù)長(zhǎng)度。

為支撐長(zhǎng)視頻理解能力，英偉達(dá)構(gòu)建了專(zhuān)屬的Eagle-Video-110K數(shù)據(jù)集。該數(shù)據(jù)集采用雙重標(biāo)注機(jī)制：既有基于GPT-4生成的章節(jié)級(jí)故事描述，也包含GPT-4o標(biāo)注的片段級(jí)問(wèn)答對(duì)，通過(guò)余弦相似度篩選確保數(shù)據(jù)多樣性。在長(zhǎng)視頻任務(wù)中，該模型對(duì)≥128幀內(nèi)容的理解準(zhǔn)確率提升23%。

性能測(cè)試顯示，Eagle 2.5在MVBench視頻理解測(cè)試中取得74.8分，較前代提升18%；在DocVQA文檔圖像解析測(cè)試中，以94.1%準(zhǔn)確率刷新行業(yè)紀(jì)錄。消融實(shí)驗(yàn)證實(shí)，移除漸進(jìn)式訓(xùn)練會(huì)導(dǎo)致長(zhǎng)視頻任務(wù)性能下降12%，而取消信息優(yōu)先采樣會(huì)令圖像細(xì)節(jié)識(shí)別率降低9%。

目前該模型已集成SigLIP視覺(jué)編碼器，支持4K分辨率圖像處理。在汽車(chē)故障檢測(cè)實(shí)測(cè)中，系統(tǒng)通過(guò)3分鐘行車(chē)記錄儀視頻，成功識(shí)別出渦輪增壓器異常震動(dòng)征兆，響應(yīng)速度較傳統(tǒng)方案快3倍。

英偉達(dá)透露，Eagle 2.5技術(shù)將優(yōu)先應(yīng)用于醫(yī)療影像分析和工業(yè)質(zhì)檢領(lǐng)域。其輕量化特性使得在邊緣設(shè)備部署成為可能，單張RTX 4090顯卡即可實(shí)現(xiàn)每秒45幀的實(shí)時(shí)視頻解析。開(kāi)發(fā)套件預(yù)計(jì)在6月向合作伙伴開(kāi)放測(cè)試。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.2079x.cn/article/716210.html

AI認(rèn)證作者

0 0

AI

谷歌Gemini 2.5 Pro預(yù)覽版更新：AI性能基準(zhǔn)全面躍升

谷歌近日對(duì)Gemini 2.5 Pro預(yù)覽版模型進(jìn)行了關(guān)鍵升級(jí)，將其更新至06-05版本，這是繼3月底該模型發(fā)布及4月輕量級(jí)Gemini 2.5 Flash推出后的又一重要進(jìn)展。目…

Google
1天前
新聞

亞馬遜宣布將投資百億在美建AI數(shù)據(jù)中心

當(dāng)?shù)貢r(shí)間6月4日，亞馬遜宣布，將在美國(guó)北卡羅來(lái)納州投資100億美元（約717.84億元人民幣），用于擴(kuò)建支持人工智能和云計(jì)算的數(shù)據(jù)中心集群。這項(xiàng)創(chuàng)紀(jì)錄的投資不僅是該州歷史上最大的單…

秋秋
1天前
AI

馬斯克官宣Dojo 2芯片：年底上線，性能對(duì)標(biāo)英偉達(dá)B200

近日，首席執(zhí)行官馬斯克通過(guò)社交媒體確認(rèn)，下一代AI訓(xùn)練芯片Dojo 2將于”今年晚些時(shí)候”正式上線，標(biāo)志著特斯拉在擺脫外部芯片依賴(lài)的戰(zhàn)略上邁出關(guān)鍵一步。他特…

AI
1天前
商業(yè)

AMD宣布收購(gòu)AI軟件優(yōu)化創(chuàng)企Brium 交易金額未予披露

今日，半導(dǎo)體巨頭AMD宣布收購(gòu)AI軟件優(yōu)化初創(chuàng)公司Brium，交易金額未予披露。此次戰(zhàn)略性收購(gòu)直指英偉達(dá)在AI硬件市場(chǎng)的主導(dǎo)地位，旨在通過(guò)強(qiáng)化軟件生態(tài)打破行業(yè)壁壘。最新動(dòng)態(tài)顯示，這…

net
2天前
AI

博楓豪擲950億克朗押注瑞典，打造歐洲最大AI計(jì)算基地之一

全球另類(lèi)資產(chǎn)管理巨頭Brookfield博楓宣布，將在瑞典投資高達(dá)950億瑞典克朗（約合712億元人民幣）建設(shè)戰(zhàn)略性AI基礎(chǔ)設(shè)施項(xiàng)目，這也是該公司在歐洲迄今規(guī)模最大的AI專(zhuān)項(xiàng)投資之…

AI
2天前
新聞

Reddit起訴Anthropic違規(guī)訪問(wèn)數(shù)據(jù)超10萬(wàn)次

據(jù)外媒報(bào)道，社交平臺(tái)Reddit于當(dāng)?shù)貢r(shí)間6月4日正式向舊金山高等法院提起訴訟，指控AI初創(chuàng)公司Anthropic在明知禁止機(jī)器人訪問(wèn)的情況下，自2024年7月以來(lái)仍對(duì)Reddit…

李森
2天前
新聞

Meta簽署20年核能協(xié)議，驅(qū)動(dòng)AI數(shù)據(jù)中心綠色轉(zhuǎn)型

Meta公司今日正式宣布與Constellation能源公司達(dá)成一項(xiàng)為期20年的戰(zhàn)略合作，將從伊利諾伊州克林頓清潔能源中心采購(gòu)核能電力，以應(yīng)對(duì)人工智能（AI）需求激增帶來(lái)的數(shù)據(jù)中心…

泡沫大盜
3天前
新聞

TikTok上線AI智能關(guān)鍵詞屏蔽：自動(dòng)攔截同義詞，越用越精準(zhǔn)

TikTok昨日正式推出“智能關(guān)鍵詞過(guò)濾器”，借助AI技術(shù)顯著提升用戶(hù)屏蔽“為你推薦”頁(yè)面不感興趣內(nèi)容的效率，為用戶(hù)打造更純凈的瀏覽體驗(yàn)。這項(xiàng)新功能在原有關(guān)鍵詞過(guò)濾基礎(chǔ)上引入AI分…

秋秋
3天前
新聞

英偉達(dá)超越微軟自1月以來(lái)首次重奪全球市值最高公司頭銜

英偉達(dá)市值超越微軟，再次成為全球市值最高的公司，增長(zhǎng)勢(shì)頭持續(xù)。半導(dǎo)體ETF上漲，OpenAI等公司大量購(gòu)買(mǎi)英偉達(dá)AI加速器，構(gòu)建更大規(guī)模的計(jì)算機(jī)集群。

蘋(píng)果派
3天前
AI

OpenAI官宣GPT-5：性能躍升，7月或成AI新標(biāo)桿

在墨西哥舉辦的AI Summit峰會(huì)上，OpenAI兩名代表正式確認(rèn)下一代基礎(chǔ)模型GPT-5即將面世，其性能將”遠(yuǎn)超現(xiàn)有GPT-4等模型”，目標(biāo)直指與谷歌G…

AI
3天前
出海

字節(jié)跳動(dòng)香港業(yè)務(wù)加速擴(kuò)張：抖音月活破300萬(wàn)，AI與電商全面布局

字節(jié)跳動(dòng)在香港業(yè)務(wù)發(fā)展勢(shì)頭強(qiáng)勁，最新數(shù)據(jù)顯示抖音App在港月活用戶(hù)突破300萬(wàn)大關(guān)，較2022年底激增147%，對(duì)比2024年同期漲幅也超60%。這表明香港近40%常駐人口已成為抖…

若安丶
3天前
商業(yè)

英偉達(dá)重奪全球市值第一頭銜芯片股領(lǐng)漲美股三大指數(shù)

周二美股市場(chǎng)全線飄紅，芯片板塊成為領(lǐng)漲主力。截至收盤(pán)，道瓊斯指數(shù)上漲214.16點(diǎn)至42519.64點(diǎn)，標(biāo)普500指數(shù)收漲0.58%，納斯達(dá)克綜合指數(shù)則以0.81%的漲幅領(lǐng)跑三大股…

商業(yè)頭條
3天前
AI

谷歌Gemini Live登陸iOS平臺(tái)，iPhone用戶(hù)可免費(fèi)體驗(yàn)AI識(shí)屏識(shí)場(chǎng)景

谷歌正式將其Gemini Live功能推向蘋(píng)果iOS/iPadOS平臺(tái)，美國(guó)區(qū)用戶(hù)現(xiàn)在打開(kāi)Gemini應(yīng)用即可收到彈窗提示，免費(fèi)體驗(yàn)全新AI交互模式。這項(xiàng)突破性功能允許用戶(hù)通過(guò)攝像…

Google
4天前
新聞

?Alphabet：谷歌將對(duì)在線搜索反壟斷裁決提升上訴

谷歌母公司Alphabet于6月1日宣布，將對(duì)美國(guó)華盛頓地區(qū)法院法官阿米特·梅塔（Amit Mehta）作出的反壟斷裁決提出上訴。該裁決要求谷歌恢復(fù)在線搜索領(lǐng)域的競(jìng)爭(zhēng)，但未采納美國(guó)…

Google
6天前
新聞

英偉達(dá)高管減持引關(guān)注黃仁勛或套現(xiàn)60億元

5月29日披露的監(jiān)管文件顯示，英偉達(dá)CEO黃仁勛計(jì)劃通過(guò)10b5-1交易計(jì)劃出售至多600萬(wàn)股公司股票，按當(dāng)前每股140美元計(jì)算，預(yù)計(jì)套現(xiàn)約8.4億美元（約合60.37億元人民幣）…

李森
2025年5月30日
AI

?Meta發(fā)布Multi-SpatialMLLM模型，實(shí)現(xiàn)動(dòng)態(tài)場(chǎng)景精準(zhǔn)解析

Meta公司于5月28日發(fā)布革命性多模態(tài)大模型Multi-SpatialMLLM，通過(guò)整合深度感知、視覺(jué)對(duì)應(yīng)和動(dòng)態(tài)感知三大核心組件，成功突破傳統(tǒng)單幀圖像分析的局限性。該模型由Met…

AI
2025年5月29日
AI

DeepSeek R1模型已完成小版本試升級(jí)：”深度思考”功能優(yōu)化提升

近日，人工智能領(lǐng)域DeepSeek R1模型已完成小版本試升級(jí)，用戶(hù)可通過(guò)官方網(wǎng)頁(yè)、移動(dòng)APP及微信小程序即刻體驗(yàn)新版本，同時(shí)API接口與調(diào)用方式保持完全兼容。此次升級(jí)延續(xù)了該團(tuán)隊(duì)…

AI
2025年5月29日
商業(yè)

?英偉達(dá)股價(jià)盤(pán)后逆勢(shì)上漲近5%，三年漲近七倍

全球AI芯片龍頭英偉達(dá)發(fā)布了2026財(cái)年一季度財(cái)報(bào)，英偉達(dá)財(cái)報(bào)顯示公司營(yíng)收達(dá)441億美元，較去年同期暴漲69%，其中數(shù)據(jù)中心業(yè)務(wù)以391億美元貢獻(xiàn)近九成收入，同比增長(zhǎng)73%12。凈…

李小白
2025年5月29日
AI

日本出臺(tái)首部人工智能法：可對(duì)違規(guī)企業(yè)實(shí)施名稱(chēng)公示等懲戒

日本參議院于5月28日表決通過(guò)該國(guó)首部人工智能專(zhuān)門(mén)法律《人工智能相關(guān)技術(shù)研究開(kāi)發(fā)及應(yīng)用推進(jìn)法》，標(biāo)志著日本在AI治理領(lǐng)域邁出關(guān)鍵一步。這部法律以促進(jìn)AI技術(shù)研發(fā)與防范濫用風(fēng)險(xiǎn)為雙重…

AI
2025年5月29日
商業(yè)

英偉達(dá)發(fā)布2025年Q1財(cái)報(bào)：營(yíng)收441億美元?jiǎng)?chuàng)新高

全球AI芯片巨頭英偉達(dá)(NASDAQ: NVDA)公布了2025財(cái)年第一季度財(cái)報(bào)。英偉達(dá)財(cái)報(bào)顯示，第一季度公司營(yíng)收達(dá)441億美元，實(shí)現(xiàn)季度環(huán)比增長(zhǎng)12%、同比猛增69%的亮眼成績(jī)?！?/p>

商業(yè)頭條
2025年5月29日

發(fā)表回復(fù)

登錄后才能評(píng)論

英偉達(dá)發(fā)布Eagle 2.5視覺(jué)語(yǔ)言模型：8B參數(shù)單挑GPT-4o

相關(guān)推薦

發(fā)表回復(fù)