一天之内,阿里、腾讯大动作
4 月 29 日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3(简称千问 3),参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。

千问 3 是国内首个 " 混合推理模型 "," 快思考 " 与 " 慢思考 " 集成进同一个模型,对简单需求可低算力 " 秒回 " 答案,对复杂问题可多步骤 " 深度思考 ",大大节省算力消耗。
千问 3 采用混合专家(MoE)架构,总参数量 235B,激活仅需 22B。千问 3 预训练数据量达 36T ,并在后训练阶段多轮强化学习,将非思考模式无缝整合到思考模型中。千问 3 在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,即创下所有国产模型及全球开源模型的性能新高:在奥数水平的 AIME25 测评中,千问 3 斩获 81.5 分,刷新开源纪录;在考察代码能力的 LiveCodeBench 评测中,千问 3 突破 70 分大关,表现甚至超过 Grok3;在评估模型人类偏好对齐的 ArenaHard 测评中,千问 3 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。
性能大幅提升的同时,千问 3 的部署成本还大幅下降,仅需 4 张 H20 即可部署千问 3 满血版,显存占用仅为性能相近模型的三分之一。
值得一提的是,记者获悉,就在同一天,腾讯对其混元大模型研发体系进行了全面重构,围绕算力、算法和数据三大核心板块,刷新团队部署,加码研发投入。
调整后,腾讯成立两个新的部门:大语言模型部和多模态模型部,分别负责探索大语言模型和多模态大模型的前沿技术,持续迭代基础模型,提升模型能力。
同时,进一步加强大模型数据能力和平台底座建设,其中数据平台部专注大模型数据全流程管理与建设,机器学习平台部则聚焦机器学习与大数据融合平台建设,为 AI 模型训练推理、大数据业务提供全面高效的 PaaS 平台底座,共同支撑腾讯混元大模型技术研发。
腾讯相关人士表示,这意味着腾讯在快速调整组织架构以应对日新月异的大模型行业发展,这次调整有利于整合资源,优化研发流程,进一步提升腾讯在 AI 领域的长期技术作战能力。
混元是腾讯自研的通用大模型,支持文本、图像、视频和 3D 等多种模态内容的理解与生成。今年以来,混元大模型技术迭代速度显著加快,相继推出快思考模型 Turbo S 和深度思考模型 T1,均在公开基准测试中达到业界领先水平,在视频生成和 3D 生成领域也推出多个新版本模型。混元 3D 生成、视频生成、DiT 文生图及千亿参数 MoE 语言模型等模型均已对外开源,GitHub 总 Star 数超过 2.9 万。
近期,国产大模型发展按下提速键 , 生成式人工智能正带来产业变革。据央视网报道,目前,我国已形成覆盖基础层、框架层、模型层、应用层的完整人工智能产业体系。最新数据显示,截至 2025 年 4 月 9 日,我国人工智能专利申请量达 1576379 件,占全球申请量的 38.58%,位居全球首位。目前,我国已累计培育 400 余家人工智能领域国家级专精特新 " 小巨人 " 企业,占据全球 1/10 的人工智能产业规模。