2025-07-10 20:34:32
7月9日,馬斯克旗下xAI發(fā)布Grok 4系列大模型,宣稱其為世界上最聰明的AI,超越博士水平,訂閱費(fèi)最高達(dá)3000美元/年。Grok 4在多項(xiàng)基準(zhǔn)測(cè)試中領(lǐng)先,馬斯克此前宣稱要用Grok 4重寫人類知識(shí)庫,但這一說法遭到了業(yè)界質(zhì)疑。方舟投資認(rèn)為,基礎(chǔ)模型的企業(yè)市場(chǎng)的規(guī)模達(dá)到15萬億到20萬億美元,有兩三家公司將脫穎而出,xAI就是其一。
每經(jīng)記者|宋欣悅 每經(jīng)編輯|蘭素英
當(dāng)?shù)貢r(shí)間7月9日,馬斯克旗下xAI的下一代大模型Grok 4系列正式發(fā)布。
馬斯克在發(fā)布會(huì)上強(qiáng)調(diào),Grok 4是目前世界上最聰明的AI。他還稱,Grok 4在所有學(xué)科上都超越了博士水平,沒有例外。不過,Grok 4的訂閱費(fèi)相當(dāng)昂貴,最高達(dá)3000美元/年(約合人民幣21530元)。
大模型性能評(píng)估平臺(tái)Artificial Analysis的全套基準(zhǔn)測(cè)試成績表明,Grok 4已經(jīng)成為當(dāng)前領(lǐng)先的AI模型,總成績達(dá)到了73分,領(lǐng)先于o3、Gemini 2.5 Pro、Claude 4 Opus等模型。
但馬斯克對(duì)于Grok 4的野心遠(yuǎn)不止于此,他此前表示,要用具有高級(jí)推理能力的Grok 4重寫人類知識(shí)庫,補(bǔ)充缺失的內(nèi)容,糾正錯(cuò)誤的知識(shí),再基于新的“干凈而準(zhǔn)確”的知識(shí)庫重新訓(xùn)練AI。不過,這一說法也遭到了業(yè)界人士的質(zhì)疑。
被稱為“木頭姐”的凱西·伍德(Cathie Wood)表示,Grok雖然起步較晚,但在性能上很快追趕上o3 pro等頭部模型,這得益于訓(xùn)練集群的合理布局。在Grok 4亮相前一周,xAI剛剛完成新一輪百億美元融資。截至目前,xAI累計(jì)融資額已超過200億美元。
圖片來源:xAI直播發(fā)布會(huì)截圖
當(dāng)?shù)貢r(shí)間7月9日,原定于太平洋時(shí)間晚上8點(diǎn)的Grok 4線上發(fā)布會(huì),延遲了幾乎整整一小時(shí)。發(fā)布會(huì)開始不久,馬斯克便高調(diào)宣稱,“這(Grok 4)是世界上最強(qiáng)的AI”。
他強(qiáng)調(diào),Grok 4在所有主要學(xué)科上的表現(xiàn)都已超越博士水平。雖然它目前尚不具備發(fā)明新理論或提出原創(chuàng)技術(shù)的能力,但馬斯克認(rèn)為,這只是時(shí)間問題。他大膽預(yù)言,Grok有望在今年年底具備發(fā)明新技術(shù)的能力,到明年則幾乎能夠擁有發(fā)現(xiàn)新物理規(guī)律的實(shí)力。
據(jù)介紹,本次發(fā)布的Grok 4系列模型包括Grok 4和Grok 4 Heavy兩個(gè)版本,均為推理模型。其中,Grok 4為單智能體模型,而Grok 4 Heavy為多智能體版本,支持多個(gè)智能體并行思考,能夠調(diào)用更大規(guī)模的計(jì)算資源以完成更復(fù)雜、更精密的任務(wù)。
大模型性能評(píng)估平臺(tái)Artificial Analysis的全套基準(zhǔn)測(cè)試成績表明,Grok 4已經(jīng)成為當(dāng)前領(lǐng)先的AI大模型,總成績達(dá)到了73分,領(lǐng)先于o3-pro、Gemini 2.5 Pro等模型。
圖片來源:Artificial Analysis
此外,在“人類終極考試”(HLE,Humanity's Last Exam)中,Grok 4系列模型也取得了亮眼的成績。最新版“人類終極考試”包含2500道專家級(jí)難度的問題,涵蓋數(shù)學(xué)、物理等多個(gè)領(lǐng)域。
據(jù)xAI介紹,今年早些時(shí)候,大多數(shù)模型在該測(cè)試中的準(zhǔn)確率得分在10%以下。而Grok 4在不使用任何工具的情況下,得分為25.4%,超過了Gemini 2.5 Pro的21.6%和o3的21%。若使用工具,Grok 4的成績進(jìn)一步提升至38.6%,Grok 4 Heavy的成績更是達(dá)到了44.4%,幾乎是Gemini 2.5 Pro的兩倍。
圖片來源:xAI直播截圖
除了“人類終極考試”,Grok 4和Grok 4 Heavy在其他基準(zhǔn)測(cè)試中同樣表現(xiàn)突出。Grok 4系列在GPQA測(cè)試中得分均接近90%,在AIME25數(shù)學(xué)競賽題上,Grok 4 Heavy更是取得了滿分的成績。
在以高難度著稱的ARC-AGI通用人工智能測(cè)試中,Grok 4在v2 Semi Private挑戰(zhàn)中獲得15.9%的分?jǐn)?shù),幾乎是第二名Claude Opus 4得分的兩倍。
圖片來源:xAI直播截圖
除了在基準(zhǔn)測(cè)試上表現(xiàn)亮眼外,Grok 4語音能力也得到了增強(qiáng)。據(jù)介紹,Grok 4的語音模式相較于上一代,端到端的延遲更低,還支持五種音色。
目前,Grok 4已經(jīng)上線,不過需要付費(fèi)使用,且訂閱費(fèi)相當(dāng)昂貴。據(jù)xAI官網(wǎng),付費(fèi)模式分為年付和月付兩種。Grok 4的訂閱年費(fèi)為300美元(約合人民幣2153元),而要想使用更強(qiáng)大的Grok 4 Heavy版本,則需要訂閱SuperGrok Heavy套餐,年費(fèi)高達(dá)3000美元(約合人民幣21530元)。
圖片來源:xAI官網(wǎng)
下一步,xAI預(yù)計(jì)還將發(fā)布代碼模型、多模態(tài)智能體以及視頻生成模型。
Grok?4的推出伴隨著不小的爭議。直播前夕,Grok?3曾因傳播不當(dāng)言論引發(fā)外界批評(píng)。有聲音認(rèn)為,xAI若不能在未來幾周內(nèi)提供更具結(jié)構(gòu)性的模型安全機(jī)制,并公布更透明的訓(xùn)練方式,Grok?4或很難擺脫“高性能之下的高風(fēng)險(xiǎn)”。
對(duì)此,馬斯克強(qiáng)調(diào),Grok?4的目標(biāo)是“成為盡可能追求真相的AI”。
在馬斯克看來,許多模型的訓(xùn)練數(shù)據(jù)本身就充斥著錯(cuò)誤與垃圾信息。他此前宣稱,要用具有高級(jí)推理能力的Grok 4重寫人類知識(shí)庫,補(bǔ)充缺失的內(nèi)容,糾正錯(cuò)誤的知識(shí),再基于新的“干凈而準(zhǔn)確”的知識(shí)庫重新訓(xùn)練AI。
圖片來源:X
不過,有觀點(diǎn)指出,馬斯克正試圖打造一個(gè)能夠體現(xiàn)自己觀點(diǎn)的模型。Cohere聯(lián)合創(chuàng)始人尼克·弗羅斯特(Nick Frosst)直言,“他(馬斯克)正努力打造一個(gè)反映其個(gè)人信念的模型。這肯定會(huì)讓模型對(duì)用戶來說更差,除非用戶恰好認(rèn)同他的所有信念,且只希望模型復(fù)述這些內(nèi)容。”
從技術(shù)層面看,馬斯克的構(gòu)想或同樣存在一些問題。谷歌DeepMind研究副總裁奧里奧爾·文亞爾斯(Oriol Vinyals)指出,如果從訓(xùn)練數(shù)據(jù)中剔除所有錯(cuò)誤,模型可能會(huì)喪失檢測(cè)和修復(fù)新錯(cuò)誤的能力。
圖片來源:X
盡管外界頻有爭議,但資本市場(chǎng)卻給出了一些積極的反饋。
作為業(yè)內(nèi)頭號(hào)馬斯克“鐵粉”的網(wǎng)紅基金經(jīng)理、有著“木頭姐”之稱的凱西·伍德(Cathie Wood)在最新一期播客節(jié)目中表示,Grok雖然起步較晚,但在性能上很快追趕上o3 pro等頭部模型,這得益于訓(xùn)練集群的合理布局,確保了訓(xùn)練的高效。
據(jù)悉,Grok 4的整個(gè)訓(xùn)練過程就動(dòng)用了全球最大的AI訓(xùn)練農(nóng)場(chǎng)“巨像”超算集群,20萬個(gè)GPU一起開工。
而且,Grok 4發(fā)布的前一周,xAI又完成了百億美元融資。目前,xAI累計(jì)融資額已超過200億美元。4月底有報(bào)道稱,xAI控股公司正在與投資者洽談,計(jì)劃為其整合后的xAI及社交媒體業(yè)務(wù)X平臺(tái)籌集約200億美元資金。若交易達(dá)成,該公司估值將突破1200億美元。
充裕的資金也為xAI的算力布局提供了堅(jiān)實(shí)保障。xAI在田納西州孟菲斯建成的超算集群“巨像”(Colossus)已經(jīng)部署了20萬塊GPU,硬件成本高達(dá)70億美元,功耗達(dá)300兆瓦,相當(dāng)于25萬戶家庭的用電量。此外,xAI還計(jì)劃建一個(gè)擁有100萬塊GPU的新設(shè)施。
凱西·伍德稱,AI基礎(chǔ)模型及相關(guān)市場(chǎng)規(guī)模龐大,而xAI有望在這一領(lǐng)域脫穎而出。她指出,借助星鏈等渠道,xAI獲得了強(qiáng)大的分發(fā)優(yōu)勢(shì)。而隨著xAI旗下模型持續(xù)迭代,X平臺(tái)的信息價(jià)值也將同步提升。X可被視為一個(gè)以揭示真相為目標(biāo)的信息平臺(tái),而xAI則專注于通過AI技術(shù)揭示真相。兩者的協(xié)同合作,能讓xAI觸達(dá)更廣泛的用戶群體,進(jìn)而形成數(shù)據(jù)優(yōu)勢(shì)。”
方舟投資認(rèn)為,基礎(chǔ)模型的企業(yè)市場(chǎng)規(guī)模將達(dá)到15萬億到20萬億美元。目前,該公司投資了xAI、OpenAI和Anthropic。凱西·伍德表示,他們相信,這三家公司在技術(shù)上處于領(lǐng)先地位,雖然未來可能會(huì)涌現(xiàn)更多專注于不同領(lǐng)域的語言模型并做得更好,但這三家公司目前仍具有顯著的競爭優(yōu)勢(shì)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP