格靈深瞳:技術(shù)筑基的長(zhǎng)期主義

4月26日,格靈深瞳(688207)發(fā)布2024年度報(bào)告。數(shù)據(jù)顯示,報(bào)告期內(nèi),公司營(yíng)收和凈利皆有所下滑。但從年報(bào)整體來(lái)看,在強(qiáng)大的技術(shù)實(shí)力和豐富的場(chǎng)景應(yīng)用產(chǎn)品的支撐下,格靈深瞳的未來(lái)仍值得期待。

實(shí)際上,就在發(fā)布年報(bào)的前一天(4月25日),格靈深瞳就在Create2025百度AI開發(fā)者大會(huì)上發(fā)布了“視覺(jué)大模型”、“政企數(shù)字員工”和“墨刃Z1 AIPC”三大產(chǎn)品,再一次印證了格靈深瞳在技術(shù)層面的硬核實(shí)力。

對(duì)于技術(shù)型企業(yè)而言,必須在日新月異的技術(shù)革新中搶占制高點(diǎn),才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中擁有立足之地。這對(duì)格靈深瞳來(lái)說(shuō),是早已刻入基因的生存法則與戰(zhàn)略核心。公司從成立以來(lái),就將技術(shù)作為立身之本,通過(guò)持續(xù)的研發(fā)投入和創(chuàng)新,持續(xù)攻堅(jiān)底層算法與場(chǎng)景化創(chuàng)新應(yīng)用,構(gòu)筑起從核心技術(shù)到產(chǎn)業(yè)落地的全鏈條壁壘。

戰(zhàn)略級(jí)研發(fā)投入,打造技術(shù)領(lǐng)先的護(hù)城河

作為一家專注于人工智能技術(shù)的公司,格靈深瞳在計(jì)算機(jī)視覺(jué)、大數(shù)據(jù)分析、機(jī)器人技術(shù)和人機(jī)交互等領(lǐng)域擁有自主研發(fā)的核心技術(shù)。充足的技術(shù)儲(chǔ)備,為公司未來(lái)產(chǎn)品的多元化和應(yīng)用場(chǎng)景的拓展奠定了堅(jiān)實(shí)的基礎(chǔ)。

數(shù)據(jù)顯示,公司成立以來(lái)一直保持高額的研發(fā)投入。以近年為例,2023年,格靈深瞳研發(fā)投入1.84億元,占營(yíng)業(yè)收入70.14%。最新的年報(bào)披露,2024年,公司研發(fā)投入達(dá)18,897.13萬(wàn)元,同比增長(zhǎng)3%。這一比例遠(yuǎn)超行業(yè)平均水平。但對(duì)于格靈深瞳而言,卻是構(gòu)筑技術(shù)護(hù)城河與搶占場(chǎng)景高地的戰(zhàn)略杠桿。

在持續(xù)的研發(fā)投入下,公司的技術(shù)儲(chǔ)備和專利數(shù)量保持雙增長(zhǎng),已有效掌握多模態(tài)大模型技術(shù)、3D立體視覺(jué)技術(shù)、自動(dòng)化交通場(chǎng)景感知與事件識(shí)別技術(shù)、大規(guī)??珑R追蹤技術(shù)、機(jī)器人感知與控制技術(shù)、視頻動(dòng)作分析技術(shù)、信息安全及可靠技術(shù)等方向的多項(xiàng)核心技術(shù),新增專利儲(chǔ)備90個(gè),為持續(xù)較快發(fā)展提供堅(jiān)實(shí)的技術(shù)支持。

以應(yīng)用為導(dǎo)向,深入布局多模態(tài)大模型技術(shù)

隨著人工智能技術(shù)的不斷發(fā)展,多模態(tài)大模型技術(shù)正憑借其整合文字、圖像、聲音等信息形式的跨模態(tài)融合能力在智慧安防、智慧教育、智慧金融等多行業(yè)展現(xiàn)出豐富的應(yīng)用潛力和強(qiáng)大的商業(yè)價(jià)值,成為人工智能領(lǐng)域的前沿方向。

谷歌研究報(bào)告顯示,全球多模態(tài)AI市場(chǎng)規(guī)模將在2025年達(dá)到24億美元,到2037年底飆升至989億美元。

對(duì)于格靈深瞳而言,公司現(xiàn)有的智慧金融、智慧體育、城市管理等業(yè)務(wù)是多模態(tài)AI技術(shù)落地的完美場(chǎng)景,多模態(tài)AI技術(shù)將極大提升格靈深瞳在這些領(lǐng)域的產(chǎn)品競(jìng)爭(zhēng)力。為此,從2024年開始,格靈深瞳就將多模態(tài)大模型技術(shù)作為重點(diǎn)研發(fā)領(lǐng)域啟動(dòng)深入布局。

2024年,格靈深瞳開啟了新募投項(xiàng)目,預(yù)計(jì)分3年合計(jì)投入募集資金3.68億元實(shí)施“多模態(tài)大模型技術(shù)與應(yīng)用研發(fā)項(xiàng)目”,開發(fā)自主可控的多模態(tài)大模型,進(jìn)一步提升模型性能。

目前,公司自研的視覺(jué)大模型Unicom采用Vision Transformer的網(wǎng)絡(luò)架構(gòu)在10億量級(jí)圖像數(shù)據(jù)上預(yù)訓(xùn)練,學(xué)術(shù)評(píng)測(cè)超過(guò)OpenAI的CLIP和谷歌的SigLIP的模型,實(shí)驗(yàn)結(jié)果已經(jīng)公布在全球計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議ECCV2024相關(guān)論文上;結(jié)合公司自研的視覺(jué)大模型Unicom和開源大語(yǔ)言模型,深瞳靈感-7B多模態(tài)大模型在具身問(wèn)答(Embodied Question Answering)任務(wù)和引用表達(dá)分割(Referring Expression Segmentation)任務(wù)中,與業(yè)界同等規(guī)模的VLM模型相比居世界領(lǐng)先地位。

技術(shù)賦能豐富應(yīng)用場(chǎng)景,兌現(xiàn)商業(yè)價(jià)值

格靈深瞳深知,再領(lǐng)先的技術(shù),如果無(wú)法落地到應(yīng)用場(chǎng)景,都將失去意義。技術(shù)的商業(yè)化落地也是市場(chǎng)對(duì)于人工智能公司長(zhǎng)期發(fā)展價(jià)值的重要衡量指標(biāo)。格靈深瞳堅(jiān)持技術(shù)跟著場(chǎng)景走,將技術(shù)研發(fā)與行業(yè)應(yīng)用場(chǎng)景緊密結(jié)合,打造了一系列AI驅(qū)動(dòng)的場(chǎng)景化智能產(chǎn)品,實(shí)現(xiàn)了商業(yè)價(jià)值的兌現(xiàn)。

在智慧金融領(lǐng)域,公司自主研發(fā)設(shè)計(jì)的智能化設(shè)備在農(nóng)業(yè)銀行各地分支機(jī)構(gòu)推廣使用,目前產(chǎn)品已覆蓋上萬(wàn)家網(wǎng)點(diǎn),包含智能安保、智能運(yùn)營(yíng)、智能風(fēng)控等多個(gè)金融業(yè)務(wù)場(chǎng)景。

在城市管理領(lǐng)域已覆蓋全國(guó)多省市的公安局、公安交通管理局、政法委員會(huì)等政府機(jī)關(guān)或企事業(yè)單位,基于視覺(jué)語(yǔ)言大模型的新一代智能視圖大數(shù)據(jù)系統(tǒng)已經(jīng)開始在各地落地試點(diǎn),車路協(xié)同感知MEC產(chǎn)品已進(jìn)行交付,同時(shí)車載視頻記錄取證設(shè)備、交通事件分析系統(tǒng)等產(chǎn)品已在多省市應(yīng)用交付。

在智慧體育領(lǐng)域,依托自研三維視覺(jué)技術(shù)推出智慧操場(chǎng)解決方案,格靈深瞳成功服務(wù)5萬(wàn)多學(xué)生,支撐了北京多個(gè)區(qū)的體育中考及體質(zhì)測(cè)試。產(chǎn)品入選工信部智能體育典型案例,并參與多項(xiàng)國(guó)家標(biāo)準(zhǔn)修訂。

2024年,公司通過(guò)收購(gòu)國(guó)科億道,成功拓展特種領(lǐng)域智能化業(yè)務(wù),融合國(guó)科億道的硬件優(yōu)勢(shì)與公司 AI 模型及軟件能力,公司軟硬一體化發(fā)展戰(zhàn)略正式落地。

當(dāng)AI競(jìng)爭(zhēng)進(jìn)入深水區(qū),格靈深瞳以技術(shù)縱深的定力與場(chǎng)景卡位的銳度,在價(jià)值兌現(xiàn)的馬拉松中越走越穩(wěn)。其成長(zhǎng)邏輯印證了AI行業(yè)的黃金法則:唯有將技術(shù)勢(shì)能轉(zhuǎn)化為可量化的商業(yè)動(dòng)能,方能在浪潮中行穩(wěn)致遠(yuǎn)。

本文轉(zhuǎn)載自:,不代表科技訊之立場(chǎng)。原文鏈接:http://news.cnmtpt.com/?Sid=11872435_3865W151912135

陳晨陳晨管理團(tuán)隊(duì)

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評(píng)論