​阿里开源下一代模型架构Qwen3-Next,模型训练及推理性价比创新高

阿里开源下一代模型架构Qwen3-Next,模型训练及推理性价比创新高

9 月 12 日,阿里通义发布下一代基础模型架构 Qwen3-Next。Qwen3-Next 针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用全新的高稀疏 MoE 架构,并对经典 Transformer 核心组件进行了重构,创新线性注意力和自研的门控注意力结合的混合注意力机制,实现了模型训练和推理的双重性价比突破。

基于这一新架构,阿里通义 " 打样 " 了 Qwen3-Next-80B-A3B 系列模型,开源指令(Instruct)和推理(Thinking)两大模型版本。新模型总参数 80B 仅激活 3B,性能可媲美千问 3 旗舰版 235B 模型,模型计算效率大幅提升。Qwen3-Next 训练成本较密集模型 Qwen3-32B 大降超 90%,长文本推理吞吐量提升 10 倍以上,并可支持百万 Tokens 超长上下文。


相关推荐

​近5万辆小鹏P7+汽车被召回

​近5万辆小鹏P7+汽车被召回

156

近5万辆小鹏P7+汽车被召回 9 月 12 日,据市场监管总局网站,日前,肇庆小鹏新能源投资有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求...

​福建舰首次通过台湾海峡意味着什么?专家解读

​福建舰首次通过台湾海峡意味着什么?专家解读

171

福建舰首次通过台湾海峡意味着什么?专家解读 来源:玉渊谭天 日前,我国第 3 艘航空母舰福建舰通过台湾海峡,赴南海相关海域开展科研试验和训练任务。这是福建舰第一次通过台...

​日本关东地区遭遇强降雨 局部发生断电事故

​日本关东地区遭遇强降雨 局部发生断电事故

203

日本关东地区遭遇强降雨 局部发生断电事故 当地时间 11 日下午,日本关东地区多地遭遇强降雨,交通大规模受阻。 △当地时间 9 月 11 日,日本东京 日本气象厅监测数据显示,在截至...

​柯克枪击案嫌疑人身份确认,系犹他州22岁男子

​柯克枪击案嫌疑人身份确认,系犹他州22岁男子

96

柯克枪击案嫌疑人身份确认,系犹他州22岁男子 当地时间 9 月 12 日,央视记者获悉,美国一执法官员透露,此前因枪杀查理 · 柯克而被拘留的嫌疑人身份已确认,系来自犹他州的 22 岁...

​从高频打到高利,高德给蒋凡“掠阵”?

116

从高频打到高利,高德给蒋凡“掠阵”? 文 | 新立场 Pro 在蒋凡带领 淘宝闪购 进入即时零售战场 133 天后,阿里巴巴再次展开布局。9 月 10 日,公司周年庆之际,高德地图上线 高德扫...

​这支00后团队想做AI Native的无限游戏

​这支00后团队想做AI Native的无限游戏

195

这支00后团队想做AI Native的无限游戏 今天的速访嘉宾来自 Mob.AI 的创始人 Vito。Mob.AI 是一支专注于打造基于 AI 驱动、无限探索的新世代交互游戏的小团队。他们开发的首款游戏 DEMO 修仙...

​高德,为阿里“扫”出一条路

​高德,为阿里“扫”出一条路

57

高德,为阿里“扫”出一条路 来源:猎云精选;文 / 孙媛 阿里 26 周岁,高德站 C 位。 9 月 10 日,在杭州西溪园区,阿里被外界称之为 重磅业务 的一场发布会揭晓。 只见高德地图作为...

​高德发布扫街榜,要拿捏美团“钱袋子”?

61

高德发布扫街榜,要拿捏美团“钱袋子”? 文 | 财经故事荟,作者 | 万天南,编辑 | 陈纪英 我们将采取一切必要措施来赢得这场竞争 ,今年 5 月,王兴曾公开叫板对手。 彼时的王兴,...

​记住5098,“就像记住我们的姓名”

​记住5098,“就像记住我们的姓名”

139

记住5098,“就像记住我们的姓名” 中国人民抗日战争纪念馆《为了民族解放与世界和平——纪念中国人民抗日战争暨世界反法西斯战争胜利 80 周年》主题展览第四部分 战略支撑 中国...

​“盟友炸盟友” 美国为何极力撇清关系?

​“盟友炸盟友” 美国为何极力撇清关系?

200

“盟友炸盟友” 美国为何极力撇清关系? 9 月 9 日,美国总统特朗普在社交平台发文称,在以色列对在卡塔尔的哈马斯高层成员发动袭击的前一刻,自己才接到美国军方关于此次行动的...