亞馬遜高管投身大模型創(chuàng)業(yè):AI公司自己賺錢會更安全

今年8月,前亞馬遜首席科學家李沐發(fā)表了一篇文章,回顧投身大模型創(chuàng)業(yè)一年的進展和思考,引起業(yè)內關注。他所在的創(chuàng)業(yè)公司是Boson AI。1個月后,第一財經記者在沙特利雅得見到了Boson AI CEO,也是公司另一名創(chuàng)始人、李沐在CMU(卡耐基梅隆大學)的博士導師Alex Smola。

創(chuàng)業(yè)公司變得非常出名并等待收購是一種路徑,但這是一種高風險的價值主張,創(chuàng)業(yè)只是為了被收購也有點奇怪。

亞馬遜高管投身大模型創(chuàng)業(yè):AI公司自己賺錢會更安全

今年8月,前亞馬遜首席科學家李沐發(fā)表了一篇文章,回顧投身大模型創(chuàng)業(yè)一年的進展和思考,引起業(yè)內關注。他所在的創(chuàng)業(yè)公司是Boson AI。

李沐的文章寫到,“如果有什么事這輩子總要試一下,就趁早,因為真開始后發(fā)現有太多新東西要學,總感嘆為啥沒早點開始(創(chuàng)業(yè))”。談到創(chuàng)業(yè),Alex Smola同樣告訴記者,他在早幾年就該如此做了,但他認為,現在永遠是正確的時間。

Alex Smola和李沐都是AI領域知名人物。Alex Smola是機器學習知名科學家,在AI領域已工作30年,2016年他加入亞馬遜擔任VP(副總裁)級別杰出科學家。李沐則是深度神經網絡框架MXNet的作者之一。兩人于2023年離開亞馬遜創(chuàng)業(yè),均成為科學家投身生成式人工智能創(chuàng)業(yè)潮的一員。

不同于企業(yè)以API接入ChatGPT等大模型的方式,Boson AI目前主要的業(yè)務是為客戶做定制模型。在采訪中,Alex Smola談及公司的商業(yè)模式、過去一年創(chuàng)業(yè)的心得和創(chuàng)業(yè)公司維持收支平衡的重要性。這或許提供了觀察一家大模型創(chuàng)業(yè)公司的切面。

市場水溫如何

在C端LLM(大語言模型)應用未成熟的情況下,市場熟知的LLM創(chuàng)收方式包括企業(yè)為接入API調用商業(yè)大模型而付費。Boson AI做的也是B端企業(yè)生意,提供的則是定制大模型業(yè)務。

據李沐講述,公司一開始創(chuàng)業(yè)“做不動”GPT-4,于是希望針對具體需求訓練模型。公司起初從頭訓練模型,隨著市面上更多高質量模型開源,公司轉向針對業(yè)務場景提升模型表現。公司先是“蒙頭”做技術,再慢慢想愿景?,F在愿景定為“人類陪伴的智能體”。據官網介紹,今年6月Boson AI推出Higgs系列LLM,該系列LLM基于Meta的開源模型Llama-3優(yōu)化,7月推出了Higgs Llama V2,同樣基于Llama。

或許是因為基于已有的開源大模型而無需從頭訓練,且在企業(yè)端找到一些應用,李沐在文章中稱公司在過去一年打平了收入和支出,為此“感謝客戶給了喘氣的時間”,讓他近期無需奔波在各個投資人之間。

為了公司獲得收入,Alex Smola的工作則包括尋找客戶,他到利雅得參加沙特數據和人工智能管理局主辦的GAIN SUMMIT世界人工智能峰會,一個目的便是希望幫助公司擴大客戶群。

LLM創(chuàng)業(yè)潮開始至今,企業(yè)拿著技術找應用是普遍現象。在B端市場,有國內主要的LLM廠商近期告訴記者,經過近一年的試驗發(fā)現,受限于LLM能力,LLM在傳統(tǒng)行業(yè)和對專業(yè)能力要求高的行業(yè)應用并不快,更多只能起到輔助性作用,還需要時間穿透進入更核心的環(huán)節(jié)。Boson AI也是在做業(yè)務的過程中逐漸確認自身愿景并探尋LLM的能力邊界。

即便Alex Smola承認LLM還難以穿透傳統(tǒng)行業(yè)一些環(huán)節(jié),他仍認為LLM能做更多?!癓LM在制造鋼鐵、電池等諸如此類的環(huán)節(jié)中作用可能沒那么大,但LLM仍可以找到一些應用場景,例如在一些白領工人可能未受到良好訓練的地方可以發(fā)揮作用。”Alex Smola告訴記者,從公司客戶群看,主要來自保險、游戲、教育等領域,這些領域有一個共同點,即與有用且有趣的對話系統(tǒng)相關。近期與聲音相關的市場需求也在變大,例如AI在呼叫中心可以提高服務質量,用于減少因呼叫中心超負荷工作導致的服務請求延遲。

“這不是要剝奪某些人的工作,而是能將(呼叫中心)需求處理時間從一年縮短至一周,擴大人類生產力。還要一段時間(AI)才會減少人力需求,人類(到時)會思考能利用創(chuàng)造力和生產力做什么?!盇lex Smola告訴記者。

與通用大模型提供API接口不同,李沐認為定制模型有推理成本更優(yōu)的好處,成本為調用API的1/10。除此之外,Alex Smola認為客戶使用定制模型可以完全控制并調整模型,而接入通用大模型API的方式難以做到,一定規(guī)模的企業(yè)將需要定制模型的這種自主權。

就LLM應用不及預期的說法,Alex Smola則認為,現在LLM應用依然很早。且LLM本身也有局限,他在峰會上談到,人類可能逐漸耗盡能用于建造LLM的tokens(詞元)。能自我學習和改進且能普遍勝任各種任務的智能系統(tǒng),或許在未來10~20年不會出現。

“很早就上LLM的公司大部分是因為CEO非常有決策力,沒被高昂的算力和人力成本嚇到,果斷推動內部團隊配合嘗試新技術?!崩钽宸Q,接下來應會有更多公司嘗試使用LLM。不過,至于定制模型是否已有很強的市場需求,Alex Smola認為這難以預測,一些意料不到的小團隊開始有這樣的需要,而一些大公司才剛開始這段旅程,很多公司距離這一步還有相當一段路。

“賺錢會更安全”

大模型創(chuàng)業(yè)公司要“燒錢”還是賺錢?先“燒錢”打響名聲、再找市場應用或再找融資,似乎是很多大模型廠商的普遍做法。但這也有一定風險,此前AI初創(chuàng)公司Stability AI曾傳出入不敷出、融不到新資金而陷入困境的消息。OpenAI每隔一段時間也會傳出虧損、需再融資的消息。

Alex Smola并不認同一味依賴籌集資金的做法?!澳憧梢曰I集資金或者自己賺錢,如果賺錢,會更安全。”Alex Smola告訴記者,“你也可以(籌集資金)變得很大、很顯眼,‘燃燒得非常明亮’,然后倒塌。像Stability,他們有幾年非常出名,非常耀眼且有很多錢,我覺得他們不太關注收入。如果更早關注收入,情況可能與現在不同?!?/p>

Alex Smola告訴記者,創(chuàng)業(yè)公司變得非常出名并等待收購是一種路徑,但這是一種高風險的價值主張,創(chuàng)業(yè)只是為了被收購也有點奇怪。而如果公司關心收入、關心客戶,市場會對公司的產品做出反饋,幫助公司優(yōu)化產品。

在大模型創(chuàng)業(yè)依然火熱、投資機構對創(chuàng)業(yè)項目仍感興趣的當下,是要維持這種收支平衡,還是拿到更多融資、放手大干一場,包括Boson AI在內的創(chuàng)業(yè)企業(yè)都在做出抉擇。李沐在文章中提到公司原本若繼續(xù)融資或許也能跟友商一般“十億現金在手”,但當時考慮到融資太多不好退出或被“架到天上去”沒有這么做,現在想來“創(chuàng)業(yè)就是逆天改命,想什么退路”。Alex Smola至今則仍顯得謹慎。

“或許因為我比其他一些創(chuàng)始人年長,我更多關注整體財務和風險,我在亞馬遜工作7年,這可能教會我一些需要注意的事。李沐比我年輕一些,他可能更追求風險,我可能更保守,但我們有很好的合作關系。”Alex Smola表示,如果回顧過去,他應該早兩年創(chuàng)業(yè),但好在沒有繼續(xù)等下去,現在公司的商業(yè)模式還不完美,但已經顯得“有趣”,定制模型之外未來或還會有其他可能。

原創(chuàng)文章,作者:蘋果派,如若轉載,請注明出處:http://m.2079x.cn/article/680058.html

蘋果派的頭像蘋果派管理團隊

相關推薦

發(fā)表回復

登錄后才能評論