阿里巴巴正式发布了 Qwen 系列新一代旗舰模型 ——Qwen3.6-Max-Preview。这一模型是该系列的早期预览版,用户可以在 QwenStudio 中与之进行交互对话,并通过阿里云百炼 API 以 qwen3.6-max-preview 的名称进行调用。与前一代 Qwen3.6-Plus 相比,Qwen3.6-Max-Preview 在智能体编程、世界知识和指令遵循等多个方面都有了显著提升。

根据阿里巴巴的介绍,Qwen3.6-Max-Preview 在六项主要编程基准测试中取得了最高分,这些基准包括 SWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench 以及 SciCode。这些成绩标志着该模型在编程能力上迈出了重要一步。具体来说,在智能体编程能力方面,Qwen3.6-Max-Preview 在 SkillsBench 中提高了 9.9 分,在 SciCode 中提升了 10.8 分,而在 NL2Repo 和 Terminal-Bench2.0 中分别提升了 5.0 分和 3.8 分。
此外,Qwen3.6-Max-Preview 在世界知识的掌握上也有显著增强,SuperGPQA 的分数提升了 2.3 分,QwenChineseBench 则提高了 5.3 分。同时,该模型在指令遵循能力方面表现出色,ToolcallFormatIFBench 的分数提高了 2.8 分。这些提升使得 Qwen3.6-Max-Preview 成为了智能编程领域的重要创新。
尽管这是预览版本,阿里巴巴表示,Qwen3.6-Max-Preview 仍在积极开发中,后续版本将继续进行优化,力争在未来带来更为强大的功能和性能提升。
划重点:
🌟 Qwen3.6-Max-Preview 是阿里巴巴发布的最新旗舰模型,具有显著的编程能力提升。
📈 六项编程基准测试中,该模型均取得最高分,展示出强大的智能编程能力。
🔧 该模型仍在开发中,未来将继续优化以提供更优质的服务。




