在中國(guó)臺(tái)北舉行的2023年國(guó)際電腦展上,英偉達(dá)首席執(zhí)行官黃仁生向世界展示了游戲和人工智能碰撞的場(chǎng)景——一個(gè)令人驚嘆的賽博朋克拉面店的圖像渲染,在那里你可以和店主交談。
將它想象你可以按住一個(gè)按鈕,用自己的聲音說(shuō)點(diǎn)什么,然后從電子游戲角色那里得到答案,而不是點(diǎn)擊對(duì)話選項(xiàng)。英偉達(dá)稱其為“窺探游戲的未來(lái)”。
不幸的是,實(shí)際的對(duì)話還有很多需要改進(jìn)的地方——也許下次可以試試GPT-4或Sudowrite, Nvidia?
對(duì)話過(guò)程中很難看出這比從NPC對(duì)話樹中挑選更好——但令人印象深刻的是,生成式AI對(duì)自然語(yǔ)音做出了反應(yīng)。希望英偉達(dá)會(huì)發(fā)布演示,這樣我們就可以自己嘗試一下,得到一些完全不同的結(jié)果。
演示是由Nvidia和合作伙伴Convai制作的,以幫助推廣用于創(chuàng)建演示的工具——特別是一套名為Nvidia ACE (Avatar Cloud Engine,阿凡達(dá)云引擎)的中間件,它可以在本地和云中運(yùn)行。整個(gè)ACE套件包括該公司用于部署大型語(yǔ)言模型(llm)的NeMo工具,Riva語(yǔ)音到文本和文本到語(yǔ)音等。
演示使用的不僅僅是這些,當(dāng)然——它是在虛幻引擎5中內(nèi)置的,帶有大量的光線追蹤……它的視覺(jué)效果令人驚嘆,相比之下,聊天機(jī)器人的部分讓我覺(jué)得平淡無(wú)奇。在這一點(diǎn)上,我們只是看到了聊天機(jī)器人更引人注目的對(duì)話,即使它們有時(shí)是陳腐和衍生的。
在2023年國(guó)際電腦展上,英偉達(dá)GeForce平臺(tái)副總裁Jason Paul告訴我,這項(xiàng)技術(shù)可以同時(shí)擴(kuò)展到多個(gè)角色,理論上甚至可以讓npc相互交談,但他承認(rèn)他還沒(méi)有看到實(shí)際測(cè)試。
目前還不清楚是否有開發(fā)商會(huì)像演示版本那樣采用整個(gè)ACE工具包,但《S.T.A.L.K.E.R. 2:切爾諾貝利之心》和《索利斯堡》將使用英偉達(dá)稱為“Omniverse Audio2Face”的部分,該部分試圖將3D角色的面部動(dòng)畫與配音演員的演講相匹配。
原創(chuàng)文章,作者:若安丶,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.2079x.cn/article/572066.html