字節(jié)大模型策略:自研加平臺(tái) 熱點(diǎn)評(píng)

2023-06-29 13:39:56

來源:手機(jī)網(wǎng)易網(wǎng)


【資料圖】

這周,字節(jié)跳動(dòng)旗下云計(jì)算服務(wù)火山引擎推出方舟大模型平臺(tái),引入了智譜 AI、MiniMax 等 7 家創(chuàng)業(yè)公司 / 研究機(jī)構(gòu)的大模型,對(duì)外出售服務(wù)。相關(guān)公司和機(jī)構(gòu)在火山引擎活動(dòng)會(huì)場開設(shè)展臺(tái),創(chuàng)始人或聯(lián)合創(chuàng)始人到場宣布未來會(huì)和火山引擎有更深入的合作。

為了吸引創(chuàng)業(yè)公司把模型放在火山引擎上,字節(jié)跳動(dòng)把抖音等業(yè)務(wù)的空閑計(jì)算資源極速調(diào)度給火山引擎,并比同行更低的價(jià)格出售算力服務(wù)。火山引擎總裁譚待說中國大多數(shù)大模型公司都用火山引擎訓(xùn)練,在火山引擎上做推理也順理成章。

今年初,為了抓住人工智能大模型的機(jī)會(huì),字節(jié)跳動(dòng)組建了至少三個(gè)團(tuán)隊(duì)開發(fā)大模型,找英偉達(dá)下單超 10 億美元的 GPU,兩年前卸任 CEO 的創(chuàng)始人張一鳴也開始看相關(guān)論文,與一些團(tuán)隊(duì)交流心得。

投入大量資源的字節(jié)跳動(dòng),目標(biāo)不只是像 OpenAI 那樣開發(fā)出大模型,還希望憑借豐富的 GPU 儲(chǔ)備建立一個(gè)平臺(tái),作為中間商幫創(chuàng)業(yè)公司訓(xùn)練、出售大模型。

按照譚待的說法,他們將來還會(huì)引入更多大模型,字節(jié)跳動(dòng)自研的大模型,除了應(yīng)用到業(yè)務(wù)中,也會(huì)放在平臺(tái)里對(duì)外銷售。他說這么做基于兩個(gè)判斷:大模型市場不會(huì)出現(xiàn)少數(shù)幾個(gè)大模型通吃的局面、企業(yè)會(huì)用多個(gè)模型開發(fā)應(yīng)用或改造業(yè)務(wù)。

“超級(jí)大模型效果好,性價(jià)比不高,不是所有問題都需要超級(jí)模型”,譚待接受采訪時(shí)說,再加上不同行業(yè)解決問題不同,模型訓(xùn)練數(shù)據(jù)也不一樣,因此會(huì)有針對(duì)特定行業(yè)或者不同參數(shù)量(決定成本)的大模型存在。

大模型是中國云計(jì)算公司的機(jī)會(huì)已經(jīng)形成行業(yè)共識(shí)。但它們抓機(jī)會(huì)的方式有差別——百度和阿里都是先自研大模型,然后對(duì)外提供服務(wù)。騰訊現(xiàn)在還沒有發(fā)布自研模型,馬化騰說 “不急于一時(shí)”,騰訊先做的是建立平臺(tái),吸引行業(yè)方向的大模型進(jìn)駐,對(duì)外提供服務(wù)。(賀乾明)

關(guān)鍵詞: