当前位置:首页 > 经济导报 > 头版

生成一个品牌官网最快只需5分钟

阿里云又一“王炸”级开源模型问世

2025-07-28 作者: 石潇懿 来源: 经济导报
  导报讯(记者 石潇懿)AI大模型厂商在AI编程领域的竞争逐渐白热化。7月23日清晨,阿里云通义团队投下了一颗“重磅炸弹”:全新的通义千问AI编程大模型Qwen3-Coder正式开源。阿里巴巴表示,“这是我们迄今为止最具代理能力的代码模型,编程能力登顶全球开源模型阵营。”如此表态,足以证明阿里巴巴对这款产品的重视程度。
  据介绍,Qwen3-Coder是千问系列模型中首个采用混合专家MoE架构的代码模型。技术细节显示,模型总参数量达4800亿,激活参数为350亿,原生支持256K token上下文,并可通过YaRN技术扩展至1M token,这意味着它可完整解析大型代码仓库或整本学术专著。
  在多项关键评测表现中,Qwen3-Coder不仅超越GPT4.1等闭源模型,更直接比肩当前全球公认最强的编程模型Claude4,堪称惊艳。
  在衡量智能体能力的WebArena(浏览器调用)和BFCL(工具调用)评测中,Qwen3-Coder刷新开源模型纪录,超越GPT4.1。
  Qwen3-Coder在代码占比70%的7.5T数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及Agent能力的飞升。
  更具突破性的是SWE-Bench评测——在这项考察模型自主规划解决编程任务的权威测试中,Qwen3-Coder与Claude4打成平手。要知道Claude4此前是编程领域的王者,而开源的Qwen3-Coder实现了零差距超越。
  Qwen3-Coder的实战表现更令人震撼:在执行复杂任务时,Qwen3-Coder调用工具数量是Claude的数倍。这种多工具协同能力使其在网页开发、AI搜索等场景中表现卓越。“借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。”
  目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者都可以免费下载使用。Qwen3-Coder很快将接入阿里的AI编程产品通义灵码,API也已上线阿里云百炼。
  为方便开发者更好地使用Qwen3-Coder,阿里云通义团队还开源了一款命令行工具Qwen Code,可充分发挥Qwen3-Coder在代理式编程上的潜力。此外,Qwen3-Coder的API也可以和Claude Code、Cline等工具协同使用。
  “2019年,我们还在讨论单点突破的语言模型,到2025年的今天,大模型已呈现‘周级迭代’的爆发态势。”7月27日,阿里云副总裁、大数据和智能实验室负责人叶杰平在2025世界人工智能大会(WAIC 2025)上表示,当前AI模型技术正经历从“渐进式创新”到“指数级跃迁”的历史性转变,以通义千问为代表的开源模型已成为这场变革的重要力量。
  在年报股东信中,阿里表示,要将“Al+云”为核心的科技业务打造成阿里巴巴的第二增长曲线;未来十年,最大的增量和变量都是以AI为核心的驱动力带来的变革。2025财年年报显示,阿里云财年收入突破双位数增长,AI相关产品收入连续七个季度实现三位数同比增长。