Snipaste_2025-06-30_10-36-11.jpg

根據(jù)華為官方的介紹,盤古7B模型為雙系統(tǒng)框架,具備“快思慢想”功能,能夠根據(jù)任務(wù)復(fù)雜度自動選擇合適的模式,即在常規(guī)請求下使用“快思考”模式,在復(fù)雜推理任務(wù)下使用“慢思考”模式,從而在延遲和推理深度之間實現(xiàn)平衡。在多款復(fù)雜推理測試中,盤古7B的性能要強于阿里巴巴旗下的Qwen3-8B、智譜旗下的GLM4-9B,

arch.PNG

盤古72B則為MoE混合專家模型,與一般的MoE模型不同,華為提出了一種新型的分組混合專家模型MoGE,其優(yōu)點在于可以在專家選擇階段對專家進(jìn)行分組,約束token在每個組內(nèi)激活等量專家,進(jìn)而實現(xiàn)負(fù)載均衡。

性能方面,華為聲稱該模型針對昇騰300I Duo、800I A2平臺進(jìn)行優(yōu)化,在后者上可以實現(xiàn)單卡1148 token/s的推理速度。

640.jpg

Snipaste_2025-06-30_10-29-10.jpg

根據(jù)SuperCLUE中文大模型基準(zhǔn)測評5月的數(shù)據(jù),盤古72B在開源排行榜中位列第五,總分為58.75分,超越Qwen3-14B、Qwen3-8B,僅次于DeepSeek-R1滿血版、DeepSeek-V3滿血版以及Qwen3-32B和235B。

值得一提的是,盤古72B的文本理解與創(chuàng)作得分位居榜單之首,為80.48分,但在科學(xué)推理能力上僅有39.6分,明顯弱于位居榜單前列的其余模型。

640 (1).jpg

此外,在推理模型榜單中,盤古72B的推理能力得分為60.3,并未有明顯領(lǐng)先優(yōu)勢。一定程度上說明盤古系列開源模型的推理性能還有待進(jìn)步。


點個贊299
分享到:

發(fā)表評論注冊|