上證報中國證券網(wǎng)訊(記者 時娜)10月26日,SuperCLUE發(fā)布中文大模型10月榜單,GPT4繼續(xù)位列第一,vivo自研大模型以70.74的總分位列總排行榜第四,在國內(nèi)大模型中排行第一,排在其后的分別是月之暗面的Moonshot、百度的文心一言4.0和商湯科技的SenseChat 3.0。SuperCLUE指出,國內(nèi)第一梯隊大模型格局已基本形成,vivo自研大模型等頭部中文大模型已經(jīng)與GPT3.5極為接近,評分表現(xiàn)令人振奮。
SuperCLUE是業(yè)內(nèi)極具權(quán)威的中文通用大模型多層次綜合性測評基準(zhǔn),在本次評測中,SuperCLUE選取當(dāng)下國內(nèi)外最具代表性的20個通用大語言模型,設(shè)置了全新的3754道測試題,全面考察大模型在中文能力上的表現(xiàn),最終評選出總排行榜等5大榜單。
從榜單可以看出,國內(nèi)大模型產(chǎn)品競爭依然激烈。vivo自研大模型在總排行榜、多輪開放問題OPEN排行、十大基礎(chǔ)能力榜單實現(xiàn)3榜領(lǐng)跑,文心一言4.0和SenseChat 3.0躋身三大能力客觀題OPT排行榜前三,各家大模型均在特定領(lǐng)域展現(xiàn)出相對競爭優(yōu)勢。
據(jù)此前消息顯示,2023 vivo開發(fā)者大會將于11月1日正式開幕,vivo將在大會期間發(fā)布5款自研大模型矩陣,包括十億、百億、千億三個不同參數(shù)量級。