7月30日,阿里巴巴通義千問團(tuán)隊宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。這一非思考模式(non-thinking mode)的開源模型僅需激活3B參數(shù),即可在多項核心能力上達(dá)到與Gemini 2.5-Flash(non-thinking)、GPT-4o等閉源模型相當(dāng)?shù)男阅芩剑瑫r在多語言覆蓋、用戶偏好對齊和長文本處理等領(lǐng)域?qū)崿F(xiàn)突破性提升。目前,該模型已在魔搭社區(qū)(ModelScope)和HuggingFace平臺全面開源。
作為Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延續(xù)了通義千問團(tuán)隊在架構(gòu)創(chuàng)新上的優(yōu)勢,在大幅降低計算成本的同時,實(shí)現(xiàn)了與千億級閉源模型的性能對標(biāo)。官方數(shù)據(jù)顯示,該模型在數(shù)學(xué)推理(AIME25測試得分61.3)、代碼生成(LiveCodeBenchv6得分43.2)、研究生級物理和天文學(xué)問題(GPQA測試得分70.4)、人類偏好對齊(Arena-Hard v2得分69)、函數(shù)調(diào)用能力(BFCL-v3得分65.1)等關(guān)鍵基準(zhǔn)測試中表現(xiàn)突出,部分指標(biāo)甚至超越GPT-4o等。
在通用能力層面,模型全面強(qiáng)化了指令遵循、邏輯推理、數(shù)學(xué)、科學(xué)、編程及工具使用等多方面。在多語言的長尾知識覆蓋方面,模型進(jìn)步顯著;在主觀和開放任務(wù)中,新模型與進(jìn)一步緊密對齊了用戶偏好,可以生成更高質(zhì)量的文本,為用戶提供更有幫助的回答;長文本理解能力提升至256K。
通義千問是阿里巴巴達(dá)摩院自主研發(fā)的大語言模型系列,自2023年發(fā)布以來,已開源超200個模型,全球下載量突破3億次,衍生模型數(shù)超10萬個。