一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

Text-to-Video文生視頻,繼作文、繪畫之后AI殺入的又一領(lǐng)域,有越來越多產(chǎn)品涌現(xiàn)。根據(jù)讀者爆料,一款主打AI生成視頻的產(chǎn)品,已經(jīng)在小圈子內(nèi)被頻頻提及,還是國產(chǎn)的。更重要的是,用它制作一段視頻,幾乎不存在“剪輯”

Text-to-Video文生視頻,繼作文、繪畫之后AI殺入的又一領(lǐng)域,有越來越多產(chǎn)品涌現(xiàn)。根據(jù)讀者爆料,一款主打AI生成視頻的產(chǎn)品,已經(jīng)在小圈子內(nèi)被頻頻提及,還是國產(chǎn)的。

更重要的是,用它制作一段視頻,幾乎不存在“剪輯”這個步驟,比以往圖文轉(zhuǎn)視頻的產(chǎn)品門檻更低,耗費的時間也更短。

什么樣的產(chǎn)品?

這產(chǎn)品名叫一幀秒創(chuàng),本次體驗的主角是它最基礎(chǔ)常規(guī)的“文案一鍵生成視頻”。點擊該選項后,會跳出一個文本框供輸入標(biāo)題和正文,底端可以選擇最終的畫面呈現(xiàn)形式是橫屏還是豎屏。

這一步驟實測下來,標(biāo)題部分對后續(xù)內(nèi)容生成影響不大,現(xiàn)階段可以不用輸入,后續(xù)AI會自動提取補(bǔ)充。相對而言,第二個需要輸入文案內(nèi)容的部分非常重要。

量子位做了如圖文案輸入:

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

點擊右下角“下一步”,可以更改AI對文案進(jìn)行的分類,也可以修改文案的分割。分割成n個小段的文案,承擔(dān)分鏡頭腳本文案的功能,以便后續(xù)AI從素材庫里匹配對應(yīng)的視頻片段。

在這方面,AI的分割效果沒有出太大紕漏。

但從下圖可以看到,此處AI把曹操title中的“書法家”單獨作為一個分鏡頭文案,量子位對其進(jìn)行了合并。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

接下來就會進(jìn)入最后的調(diào)試界面,分出兩大板塊,即左半部分的調(diào)整界面和右半部分的預(yù)覽界面。通過左側(cè)的工具欄,在最頂端的場景部分,AI為文案匹配了12個視頻片段。

12個視頻片段中,原本AI為片段8生成的視頻中出現(xiàn)了現(xiàn)代社會的外國人。也就是說,在畫面內(nèi)容和文案內(nèi)容的匹配度上,AI能力還有所欠缺。

最終量子位通過小藍(lán)框中的替換素材功能,在素材庫中選擇了更符合文案的視頻畫面。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

12個鏡頭整體拉片式通看一遍,直觀感受是視頻質(zhì)量算不上精致。雖然并非完全不相關(guān),但還是與人類剪刀手的視頻編輯水平有明顯差距。

敲定視頻片段后,在音樂板塊挑選國風(fēng)類型的BGM,又選擇了“磁性渾厚”的解說男聲,Logo和字幕都是默認(rèn)選項。

一切確定,點擊生成視頻選項,就能在預(yù)覽板塊看到這一套搭配下來的視頻效果。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

歷史分類的AI視頻效果不錯,那是否在每個分類下都有同等水平的效果呢?

又陸續(xù)還嘗試了科普類(量子位文章,扔進(jìn)去)、美食類(宮保雞丁菜譜)等多種類別的文案,甚至還把谷歌Phenaki效果驚艷的小企鵝沖浪視頻的6句文案丟給了它。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

結(jié)果顯示,科普類和美食類,生成視頻的表現(xiàn)都還算文案和畫面貼合。

但,小企鵝沖浪文案的生成效果就有些Emmm:看遍視頻畫面的每一秒鐘,從未出現(xiàn)過一只企鵝,連影子都沒有……Excuse me???

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

雖然部分畫面也和文案有所關(guān)聯(lián),比如出現(xiàn)人在沙灘上走的第一視角視頻片段。但和曹操視頻的效果相比,可以說大相徑庭,實在有點出乎意料。

無獨有偶,國外有個Quickvid同樣主打AI生成視頻的功能,同樣在小圈子里走紅。而目前開放Beta測試的Youtube Shorts功能,和上述國內(nèi)產(chǎn)品功能類似。

為了測試,把相同的小企鵝沖浪文案喂給了Quickvid。結(jié)果是,Quickvid生成的視頻里,仍然不見企鵝的蹤影,一幀也沒有!(谷歌Phenaki聽后狂喜)

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

當(dāng)然,Quickvid之所以走紅,并不是因為生成的視頻質(zhì)量驚人。除了成為文本生成視頻賽道的“早鳥”外,與背后的開發(fā)者密切相關(guān)。

開發(fā)者小哥名叫Daniel Habib,此前在Facebook的虛擬現(xiàn)實部門Oculus工作。

Quickvid走紅是從今年2月開始的,當(dāng)時它正式從內(nèi)測轉(zhuǎn)為Beta測試,僅2月23日一天,就有2萬2千多人成為用戶。本月ChatGPT開放API后,Daniel把它接入了Quickvid,成為了第一批ChatGPT生態(tài)內(nèi)開發(fā)者。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

量子位的視頻編輯對兩款產(chǎn)品也進(jìn)行了試玩,用戶評價是這樣的:暫不認(rèn)為這東西能威脅自己的就業(yè)。

但對于AI生成視頻展現(xiàn)出的趨勢,多少有點心有凄凄焉。

因為你不得不承認(rèn),用這玩意兒做視頻,完全不需要懂得剪輯知識。而且做一條同等質(zhì)量的視頻,相比人工剪輯,用AI生成,時間和資源投入顯著降低。

不完美的視頻創(chuàng)作AI工具

不僅僅是Quick接入了別人家的API,事實上,今天體驗的一幀秒創(chuàng)也接入了GPT-2的API,還用上了開源Stable Diffusion模型。

這不是猜測,是我們直接找到背后開發(fā)者“對質(zhì)”后得知的結(jié)果。一幀秒創(chuàng)背后的公司叫做新壹科技。這個名字或許比較陌生,但這個“新的一”是“一下科技”的“一”。

一下科技,曾經(jīng)多次站在視頻風(fēng)口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,這是移動互聯(lián)網(wǎng)時代視頻領(lǐng)域響當(dāng)當(dāng)?shù)耐婕?。背后的團(tuán)隊,也是源自搜狐視頻-酷6網(wǎng)-新浪視頻一脈的視頻內(nèi)容老兵們。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

其創(chuàng)始人兼董事長韓坤,在創(chuàng)立一下科技之前,以聯(lián)合創(chuàng)始人的身份把酷6網(wǎng)打造成中國第一家在美國納斯達(dá)克上市的視頻網(wǎng)站。新壹科技是韓坤團(tuán)隊孵化出的最新公司,現(xiàn)有團(tuán)隊在2020年年中開始籌備,領(lǐng)隊人雷濤,現(xiàn)任新壹科技CEO,也是一下科技的創(chuàng)始團(tuán)隊成員。

團(tuán)隊正式組建的2020年12月,距ChatGPT出生還有一年,連DALLE-2和Stable Diffusion代表的AI繪畫也還沒有名聲大噪,但春江水暖鴨先知,一下內(nèi)部這支團(tuán)隊感知到了AI對于視頻內(nèi)容創(chuàng)作的方向性改變。

因為視頻內(nèi)容的傳統(tǒng)和基因,新公司誕生之初,新壹并沒有把自己定位為一個人工智能公司。他們希望從首先解決創(chuàng)作者需求切入,讓AI介入視頻生產(chǎn)全流程,盡可能降低視頻內(nèi)容創(chuàng)作門檻。通過AI能力,讓用戶以低成本制作視頻,還能用秒拍平臺上的視頻為AI匹配提供一個龐大的素材庫,形成規(guī)模壁壘。

把秒拍作為現(xiàn)成的數(shù)據(jù)庫,這對新壹算是一個地利,不僅因為秒拍有10億級規(guī)模的視頻素材和數(shù)據(jù),更因為秒拍能為一幀秒創(chuàng)進(jìn)行版權(quán)授予,讓AI生成的視頻得到了一定的“保障”,后者是AIGC方面一直爭論不休的大問題之一。

所以首款產(chǎn)品一幀秒創(chuàng),有了明確的應(yīng)用場景,也有了面向視頻內(nèi)容創(chuàng)作者、視頻自媒體營銷的方向。這是一個集合多種AIGC能力的工具,但是,無論是文生圖還是AI幫寫,最終的目的都?xì)w于一處——把它們作為素材應(yīng)用到視頻生產(chǎn)流程,讓視頻生產(chǎn)更加高效。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

為了高效和低門檻,一幀秒創(chuàng)盡量做到去剪輯化,創(chuàng)作視頻的過程從開放式變成了填空式。雖然距離產(chǎn)出極致和精彩的視頻還有距離,但最直觀的是,哪怕完全不懂剪輯知識的人,也能上手制作視頻——甚至是批量制作。

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

 

社交平臺的剪輯小白用戶評價

目前,一幀秒創(chuàng)方面也知道,自己生成的視頻還不能和人工剪輯的視頻媲美,但是足以應(yīng)對一些應(yīng)用場景,如科普類視頻生成效果是最好的,批量生產(chǎn)內(nèi)容可以應(yīng)用到抖音本地生活推廣。以及除了面向C端的高階功能訂閱模式,一幀秒創(chuàng)還有來自B端的商業(yè)合作,比如跟360搜索的合作,已經(jīng)獲得了不錯的反饋。

對于一幀秒創(chuàng)當(dāng)前的初創(chuàng)狀態(tài),新壹也透露正在通過一些具體的解決方案改進(jìn)。

比如創(chuàng)作者集中的內(nèi)容類別,投入更多的素材分析和標(biāo)注成本;又比如推出私有化素材庫,提高匹配率和視頻片段替換率。

雷濤表明了一幀秒創(chuàng)的思路,稱作為產(chǎn)品公司,新壹科技雖然沒辦法讓技術(shù)和硬件等基礎(chǔ)條件實現(xiàn)跨越式的發(fā)展,然而,能夠在每一階段適時提供符合當(dāng)時階段水平的應(yīng)用,“這已經(jīng)足夠去忙了”。

他多次以智能手機(jī)時代開啟后,移動互聯(lián)網(wǎng)的產(chǎn)品開發(fā)機(jī)遇舉例,也多次用新能源、智能車變革進(jìn)程中的理想造車模式類比,話里話外意在追求的不是一步到位,而是與技術(shù)基礎(chǔ)設(shè)施和整個行業(yè)生態(tài)一起成長進(jìn)步,而最關(guān)鍵的是,必須躬身入局,不能站著觀望。

這其中自然有視頻老兵對新周期的敏銳洞察,但也多少有些不甘心。如果你對2015年以來的互聯(lián)網(wǎng)江湖還有記憶,應(yīng)該多少能感知這種不甘心的合情合理。在如今字節(jié)獨大或抖音快手的雙雄格局之前,秒拍和一下科技,才是短視頻領(lǐng)域最火爆的明星公司。然而商場如戰(zhàn)場,如今的結(jié)局和市場份額,已經(jīng)再清楚不過了。

或許“贏回來”的最好方法就是贏在未來、贏在下一個時代,而下一個時代就是AIGC!畢竟連比爾·蓋茨都說,背后不亞于互聯(lián)網(wǎng)的發(fā)明。

兩撥創(chuàng)業(yè)者的不同路線

一幀秒創(chuàng)“文案一鍵生成視頻” 讓視頻制作駛上”高速公路”

事實上,面向這個全新的創(chuàng)新創(chuàng)業(yè)賽道,已經(jīng)分出了兩撥創(chuàng)業(yè)者,走出了不同條路線。

一條是技術(shù)路線,訓(xùn)練大模型,把底層技術(shù)牢牢掌握在自身的手里,做底層,做平臺。但門檻極高,創(chuàng)業(yè)公司在底層大模型方面取得突破的難度和成本都會很高;另一條就是面向需求和場景,走產(chǎn)品、應(yīng)用、工具平臺的路線,集成開源和開放的現(xiàn)有技術(shù),先入場再發(fā)展壯大,這也是更多中小創(chuàng)業(yè)者和開發(fā)者最可見的機(jī)遇。

這兩種路線也不稀奇。一如當(dāng)初蘋果做出了iOS系統(tǒng),有人對標(biāo)iOS,要研發(fā)新手機(jī)系統(tǒng),建立新生態(tài);也有許許多多的開發(fā)者基于iOS做各種創(chuàng)造,在游戲、開發(fā)、創(chuàng)作、工具類別下瘋狂推出各種適配iOS系統(tǒng)的App。

技術(shù)和應(yīng)用兩條道路,都能有玩家走到最后,完成商業(yè)化閉環(huán),選擇不同而已,沒有優(yōu)劣之分。從來沒有事實能篤定表明,其中某一種能一統(tǒng)天下。

據(jù)透露,走產(chǎn)品應(yīng)用路線的一幀秒創(chuàng),已經(jīng)快速積累了近200萬用戶,每日的視頻生成量在10萬級——這算不算AIGC時代的船票還不好說,但至少讓外界看到變數(shù)發(fā)生的可能。

(文章來源:量子位)

(本內(nèi)容屬于網(wǎng)絡(luò)轉(zhuǎn)載,文中涉及圖片等內(nèi)容如有侵權(quán),請聯(lián)系編輯刪除。市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣及投資依據(jù)。)

原創(chuàng)文章,作者:陳晨,如若轉(zhuǎn)載,請注明出處:http://m.2079x.cn/article/570150.html

陳晨陳晨管理團(tuán)隊

相關(guān)推薦