在5月27日閉幕的第15屆中國(深圳)國際文化產(chǎn)業(yè)博覽交易會上,騰訊集團副總裁、騰訊研究院院長司曉以《大模型時代文化內(nèi)容生產(chǎn)的范式革命》為題發(fā)表主旨演講,系統(tǒng)闡述了大模型技術對文化內(nèi)容生產(chǎn)、傳播及產(chǎn)業(yè)生態(tài)的顛覆性變革。他指出,大模型已從“工具賦能”躍升為“生態(tài)重構”,推動文化內(nèi)容產(chǎn)業(yè)從“專業(yè)主導”向“全民共創(chuàng)”跨越,并加速文化傳承與創(chuàng)新的深度融合。

以下是司曉的演講內(nèi)容整理。
人工智能的加速演進為文化內(nèi)容領域帶來新的發(fā)展機遇。這一波生成式人工智能的發(fā)展浪潮可謂“日新月異”。以2022年底ChatGPT面世作為大模型進入公眾視野的首個重要節(jié)點,后續(xù)Midjourney、Gemini間隔數(shù)月陸續(xù)推出;而2025年未過半時Deepseek R1、Grok3等主流大模型就密集發(fā)布。毫不夸張地說,人類歷史上首次進入了技術以“天”為單位進化的時代,從技術發(fā)展到應用落地的間隔也被壓縮至無限短。
文化內(nèi)容行業(yè)已成為智能實踐的先鋒領域。騰訊研究院曾調(diào)研了百余位各行業(yè)專家,憑借業(yè)態(tài)豐富、場景明確的優(yōu)勢,文化產(chǎn)業(yè)中的傳媒、游戲等板塊對大模型的應用程度,在十多個不同行業(yè)中處于中上游位置。廣告、軟件、教育這些以智力和創(chuàng)意為核心的產(chǎn)業(yè),成為大模型滲透速度最快的領域。

來源:騰訊研究院行業(yè)大模型報告
多模態(tài)突破:內(nèi)容生產(chǎn)從”單一維度”邁向”全感官沉浸”
多模態(tài)大模型技術持續(xù)突破,生成效率與質量顯著提升。以騰訊混元為例,其文生圖能力在一年內(nèi)實現(xiàn)跨越式升級:混元圖像2.0支持邊輸入文字邊實時生成圖像,用戶可即時調(diào)整美術風格、特效等視覺元素,相較此前需等待完整生成后再修改的模式大幅優(yōu)化。文生視頻領域同樣進步明顯,2023年,有網(wǎng)友利用AI工具僅用5晚便完成《流浪地球3》“概念預告片”制作,引發(fā)導演郭帆關注。到今天,主流模型如混元、可靈到剛剛發(fā)布的谷歌Veo3,已經(jīng)逐步有效解決手部穿模等畫面缺陷,生成視頻的連貫性與物理模擬能力顯著增強,甚至可以為畫面同時匹配準確的人聲和音效。面向影視生產(chǎn)的Flow等專業(yè)工具及國內(nèi)同類軟件已實現(xiàn)腳本、分鏡、鏡頭控制等多項專業(yè)能力集成,展現(xiàn)驚人進化速度。
在文生圖片的擴散模型基礎上,疊加深度參數(shù)則升級為3D生成。騰訊在文生3D領域有諸多創(chuàng)新:混元3D生成模型2.5版本較上一版本,總參數(shù)量提升了10倍,能夠實現(xiàn)超高清的幾何細節(jié)建模。我們的同事已通過文生3D功能結合家用3D打印機,制作出原創(chuàng)玩具模型。未來,用戶不僅可以購買創(chuàng)意服務,更能自主構思創(chuàng)意,通過家用打印機直接輸出。

大模型對世界的理解與交互能力也在增強。我曾將手機作為GPT-4o大模型的“眼睛”,問它窗臺上有幾個公仔。它不僅準確回答了類型和數(shù)量——四個騰訊公仔,還在追問下識別出后方隱藏的一只兔子。盡管大模型的理解能力并非人類意義上的物理世界認知,但其基于視覺與推理能力的實現(xiàn)方式已具突破性——例如谷歌最新發(fā)布的通用AI智能體項目Project Astra,便如同鋼鐵俠的個人助理,可通過眼鏡或手機指導洗衣等日常操作,并與現(xiàn)實世界實現(xiàn)更自然交互。這些未來硬件與大模型結合的創(chuàng)新,必將為我們的生活帶來更多便利。

雖然我不是技術專家,對技術細節(jié)了解有限,但反而更能跳出細節(jié)去審視大模型當前的缺陷?,F(xiàn)階段,用戶對大模型部分能力的不滿,本質上源于對其”許愿”般的進化期待——按照當前的進化節(jié)奏,諸多技術瓶頸將在未來最長以年、最短以月為單位的時間尺度內(nèi)被突破。因此,AI在文化內(nèi)容領域的應用前景更加值得期待。
效率革命:從”人力堆砌”到”智能涌現(xiàn)”的內(nèi)容生產(chǎn)新范式
技術變革對文化內(nèi)容生產(chǎn)范式帶來的影響是廣泛而深遠的。
大模型不僅讓知識觸手可及,更大幅降低了表達能力的門檻。用戶無需深入學習專業(yè)理論和工具技法,即可創(chuàng)作出以假亂真的圖片、視頻甚至電影等復雜形態(tài)內(nèi)容。當然,創(chuàng)意本身也變得易得:例如,當寫作遇阻時,可讓大模型生成多個后續(xù)版本,從中選擇和優(yōu)化內(nèi)容,度過靈感“枯竭期”。未來,閱文等平臺上的網(wǎng)絡文學創(chuàng)作可能形成模式進化:從讀者逐章追更,到可主動“許愿”希望劇情如何發(fā)展,結合大模型的無限表達與創(chuàng)意涌現(xiàn)能力,使創(chuàng)作正真正進入“千人千面”的全新時代。
綜上,我們已進入“智力即服務”時代——人類首次通過云端模擬出一種智能形態(tài),這種智能如同水、電般“打開水龍頭或電閘”即可獲取,推動我們真正邁入AI平權時代,生產(chǎn)效率大幅提升。AIGC加持下,創(chuàng)意與表達的實際供給量趨于無窮大,內(nèi)容質量也將顯著提升,這將帶來一大批“超級創(chuàng)作個體”的崛起。
可以從兩個具體案例中看到這種趨勢:其一,上海民族樂團攜手騰訊音樂打造全國首臺國樂AI音樂會《零·壹 |中國色》。藝術家們基于“琴樂大模型”生成的音樂內(nèi)容進行二次創(chuàng)作,同時幫助大模型改進算法,使擅長西方樂理的模型更加理解民樂獨特構成方式,實現(xiàn)生成內(nèi)容從形似到神似的跨越。其二,中國傳媒大學師生制作AI短片《電火花之舞》獲國際認可。創(chuàng)作團隊借助大模型能力巧妙致敬十余部中外經(jīng)典影片,并自然融入影片故事主線,斬獲麻省理工學院(MIT)AI電影節(jié)最佳敘事獎。

向善而行:技術溫度是內(nèi)容產(chǎn)業(yè)的”終極競爭力”
最后,我想談談人工智能時代,智能向善三個重要路標“可信”“可靠”“普惠”中的“可信”問題。
大模型的“幻覺問題”成因復雜,包括技術原理、數(shù)據(jù)語料等?!盎糜X”與“創(chuàng)新”本是一體兩面,在實際應用中,可以調(diào)整大模型生成內(nèi)容的“溫度”(Temperature)參數(shù),使得生成內(nèi)容的“天馬行空”程度有所降低。但在教育、醫(yī)學等大量實際場景中,我們?nèi)匀幌M竽P吞峁┑膬?nèi)容無限接近“100%”可信。
為探索這一問題的解決方案,騰訊與多家出版機構開展合作,增加文化資源和可信大模型的雙向互動。一是共同構建出版智能體,支持用戶進行工具類圖書的內(nèi)容咨詢。例如,人民衛(wèi)生出版社基于騰訊元器智能平臺開發(fā)”人衛(wèi)知識服務”智能體,不僅能為用戶提供特定醫(yī)學領域的權威解答,還能精準定位并引用相關書籍原文,并可跳轉至書籍電商平臺進行購買。二是微信讀書不斷升級“AI問書”功能,當用戶遇到生僻古語不知出處時,選定具體文字即可在出版機構專業(yè)語料庫中快速定位來源,并展示更多相關圖書鏈接,幫助用戶打開更廣闊的知識視界。此外,在微信除紅包外新增的“藍包禮物贈送”功能中,圖書贈送是最常用的場景。這些嘗試也推進了出版社的智能化轉型。
騰訊始終定位為“科技+文化”公司,從另一維度也可稱為“連接+內(nèi)容”公司,因此我們與敦煌、長城合作開展了“云游敦煌”“云游長城”“數(shù)字藏經(jīng)洞”等多個可持續(xù)社會價值項目,騰訊始終將“科技活化傳統(tǒng)文化”作為承擔社會價值的重要方向。
“探元計劃”是這一方向下的重要實踐:項目通過征集產(chǎn)業(yè)前沿技術與文旅應用場景,推動更多來自新興科技企業(yè)的技術與場景實現(xiàn)最優(yōu)匹配。例如,我們近期與香港九龍城合作的“在九龍城 閱見香港”項目,對不同歷史時期的九龍城進行數(shù)字化,并融入專家級智能體。用戶可在H5互動體驗中游玩,同時向智能NPC提問關于九龍城的故事,獲得游戲化交互體驗。這種模式為文旅業(yè)帶來了更大的想象空間。

最后,推薦大家使用研究院在ima平臺搭建的AGI知識庫。AI以“天”為單位進化,我們團隊通過“人工+AI”方式每日搜集整理全球AI資訊,形成《AI每日速遞》,并整合至同一知識庫。這種基于人工篩選的定向知識庫對垂類知識進行了更系統(tǒng)和結構化的梳理,使大模型在回答用戶提問時可進行增強檢索,生成內(nèi)容更具可信度。推薦大家使用!
謝謝大家!
本文轉載自:,不代表科技訊之立場。原文鏈接:http://show.wolaioa.com.cn/preview/Fz4I8jSuVhe63rPlj7RuWg.html