根據(jù)華為官方的介紹，盤古7B模型為雙系統(tǒng)框架，具備“快思慢想”功能，能夠根據(jù)任務(wù)復(fù)雜度自動選擇合適的模式，即在常規(guī)請求下使用“快思考”模式，在復(fù)雜推理任務(wù)下使用“慢思考”模式，從而在延遲和推理深度之間實現(xiàn)平衡。在多款復(fù)雜推理測試中，盤古7B的性能要強于阿里巴巴旗下的Qwen3-8B、智譜旗下的GLM4-9B，

盤古72B則為MoE混合專家模型，與一般的MoE模型不同，華為提出了一種新型的分組混合專家模型MoGE，其優(yōu)點在于可以在專家選擇階段對專家進(jìn)行分組，約束token在每個組內(nèi)激活等量專家，進(jìn)而實現(xiàn)負(fù)載均衡。

性能方面，華為聲稱該模型針對昇騰300I Duo、800I A2平臺進(jìn)行優(yōu)化，在后者上可以實現(xiàn)單卡1148 token/s的推理速度。

根據(jù)SuperCLUE中文大模型基準(zhǔn)測評5月的數(shù)據(jù)，盤古72B在開源排行榜中位列第五，總分為58.75分，超越Qwen3-14B、Qwen3-8B，僅次于DeepSeek-R1滿血版、DeepSeek-V3滿血版以及Qwen3-32B和235B。

值得一提的是，盤古72B的文本理解與創(chuàng)作得分位居榜單之首，為80.48分，但在科學(xué)推理能力上僅有39.6分，明顯弱于位居榜單前列的其余模型。

640 (1).jpg

此外，在推理模型榜單中，盤古72B的推理能力得分為60.3，并未有明顯領(lǐng)先優(yōu)勢。一定程度上說明盤古系列開源模型的推理性能還有待進(jìn)步。

點個贊299

發(fā)表評論注冊|登錄

熱點資訊

好物推薦