5月20日,阿里云峰会正式开幕,阿里巴巴集团副总裁、阿里云智能CTO、阿里巴巴合伙人周靖人在会上宣布,通义千问Qwen3.7系列大模型正式发布。旗舰版Qwen3.7-Max以"全能智能体基座"为定位,在编程、推理、工具调用等能力上实现了跨越式升级,并在多项全球权威评测中刷新了国产模型的排名纪录。
千问
从综合排名来看,Qwen3.7-Max在Arena AI全球大模型文本总榜中位列第13位,超越了Gemini 3 Flash和GPT-5.5等国际模型,成为榜单前15名中唯一的国产模型。细分领域同样表现亮眼:数学能力全球第7,编程能力全球第10,专家级应用与软件及IT领域均位列第9。视觉方面,Qwen3.7-Plus预览版在视觉总榜排名第16,推动阿里实验室视觉能力跃升至全球第5。在知识和逻辑推理等主流评测中,Qwen3.7全面领先Kimi K2.6、智谱GLM5.1、DeepSeek V4 Pro、opus4.6-Max等国内及国际最新模型,稳居国内第一。
工具调用和编程能力是本次升级的重头戏。Qwen3.7的编程智能体支持复杂工程开发,在TerminalBench 2.0测试中得分69.7,超越DS-V4-ProMax的67.9分;在SWE-Pro得分60.6、SciCode得分53.5等编程基准中同样领先。更值得关注的是,在一项持续35小时、超过1000次工具调用的长周期实验中,Qwen3.7保持了稳定的推理能力,实现了端到端任务闭环。办公自动化方面,SpreadsheetBench-V1得分87.0,处于行业顶尖水平。
上一篇:智己LS6上汽一亿台限定版发布 全系标配520线激光雷达
下一篇:最后一页
类型:阅读学习 大小:173.2M
下载类型:生活实用 大小:204.9M
下载优装机下载站(https://www.uzhuangji.net/)版权所有:闽ICP备2026008968号-1
本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。





