低成本高性能,助力教育公平

據(jù)悉,“子曰3數(shù)學(xué)模型”在解決國內(nèi)數(shù)學(xué)問題任務(wù)中展現(xiàn)出了顯著優(yōu)勢。其通過大規(guī)模增強(qiáng)學(xué)習(xí)以及一系列的創(chuàng)新算法,推理性能約為DeepSeek R1的15倍。

測試數(shù)據(jù)顯示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等數(shù)據(jù)集上,14B輕量級的“子曰3數(shù)學(xué)模型”各項(xiàng)得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)這一基于高考數(shù)學(xué)題的大模型評測框架中,“子曰3數(shù)學(xué)模型”的得分高達(dá)98.5分。

image003.png

除了出色的性能,“子曰3數(shù)學(xué)模型”的成本優(yōu)勢同樣顯著,其在消費(fèi)級GPU即可運(yùn)行,大大降低了教育場景的AI應(yīng)用門檻。

事實(shí)上,中小學(xué)教育長期面臨教育資源不平等、個性化輔導(dǎo)資源不足、復(fù)雜題型講解成本高等痛點(diǎn),而教育大模型能有效輔助提升學(xué)習(xí)效果,但高性能大模型的構(gòu)建和部署成本卻非常高昂,許多低收入地區(qū)難以負(fù)擔(dān)。

針對這一問題,“子曰3數(shù)學(xué)模型”實(shí)現(xiàn)了部署性能的極致突破,服務(wù)成本每百萬token低至0.15美元,遠(yuǎn)超目前大多數(shù)通用大模型的成本效益。這意味著更廣泛的普通教育機(jī)構(gòu)和開發(fā)者都能以低成本部署專業(yè)級的數(shù)學(xué)AI應(yīng)用。

“對于行業(yè)而言,‘子曰3數(shù)學(xué)模型’證明了在低成本情況下,在特定領(lǐng)域構(gòu)建強(qiáng)大推理模型的可行性,為垂類推理大模型的研發(fā)與應(yīng)用提供了重要參考。”網(wǎng)易有道首席科學(xué)家段亦濤表示。

“AI+教育”加速進(jìn)化,子曰釋放教育大模型應(yīng)用價(jià)值

自2023年7月推出國內(nèi)首個教育大模型“子曰”以來,網(wǎng)易有道在“AI+教育”領(lǐng)域加速進(jìn)化,持續(xù)釋放大模型在教育行業(yè)的應(yīng)用價(jià)值。

從“子曰”大模型在一年內(nèi)快速推出10余個垂直應(yīng)用,到今年初發(fā)布國內(nèi)首個輸出分步式講解的推理模型“子曰-o1”,再到如今“子曰3數(shù)學(xué)模型”正式開源,網(wǎng)易有道充分結(jié)合應(yīng)用場景進(jìn)行模型迭代和優(yōu)化,持續(xù)推動教育大模型技術(shù)創(chuàng)新和應(yīng)用落地。

此次“子曰3數(shù)學(xué)模型”發(fā)布及開源,標(biāo)志著“子曰”大模型系列在輕量級模型推理能力上實(shí)現(xiàn)了又一重要突破,也使得有道在教育大模型領(lǐng)域長期積累的技術(shù)成果能夠共享給更多的開發(fā)者和從業(yè)者,構(gòu)建起協(xié)同發(fā)展的行業(yè)格局。

段亦濤強(qiáng)調(diào):“AI+教育的終極目標(biāo)不是替代教師,而是讓技術(shù)成為教育公平的杠桿。希望‘子曰3數(shù)學(xué)模型’的開源能夠吸引更多開發(fā)者加入,共同探索推理模型在教育領(lǐng)域的應(yīng)用價(jià)值。”

點(diǎn)個贊157
分享到:

發(fā)表評論注冊|