阿里发布下一代模型架构Qwen3-Next 长文本推理吞吐量提升超10倍

美羊羊3天前商机资源1

K图 BABA_0

K图 09988_0

上证报中国证券网讯(记者杨翔菲温婷)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用全新的高稀疏MoE架构,并对经典Transformer核心组件进行了重构,创新线性注意力和自研的门控注意力结合的混合注意力机制,实现了模型训练和推理的双重性价比突破。

基于这一新架构,阿里通义“打样”了Qwen3-Next-80B-A3B系列模型,开源指令(Instruct)和推理(Thinking)两大模型版本。新模型总参数80B仅激活3B,性能可媲美千问3旗舰版235B模型,模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,并可支持百万Tokens超长上下文。

近期,阿里通义动作频频。推出超万亿参数的Qwen3-Max-Preview、文生图及编辑模型Qwen-Image-edit、语音识别模型Qwen3-ASR-Flash等,并持续推进“全尺寸”“全模态”开源。全球AI开源社区HuggingFace最新数据显示,通义千问Qwen衍生模型数已超17万,稳坐全球第一开源模型。通义千问也是中国企业使用量最多的模型,沙利文报告显示,2025年上半年,在中国企业级大模型调用市场中,阿里通义占比17.7%位列第一。

相关文章

今年股价涨幅近两倍、市值超780亿元的芯原股份 上半年亏损额却在同比扩大

今年股价涨幅近两倍、市值超780亿元的芯原股份 上半年亏损额却在同比扩大

8月22日,芯原股份(688521.SH,股价149.82元,市值787.6亿元)公布了2025年半年度报告。公司上半年营收为9.74亿元,同比增长4.49%,归母净利润为亏损3.2亿元,上年同期为...

A股赚钱效应明显!200万新股民跑入A股 债市大跳水

A股赚钱效应明显!200万新股民跑入A股 债市大跳水

今天A股创造了多个历史,而债市却遭到抛售,股债跷跷板现象出现! 8月18日,上证综指上破3700点, 赚钱效应明显。 截至收盘,A股市场成交额攀升至2.76万亿元,两融余额再度突破2万亿元,这是继8月...

深圳扶持民企站到科创“C位”

深圳扶持民企站到科创“C位”

深圳市明确提出,民营经济是深圳高质量发展的重要基础,是深圳加快打造更具全球影响力的经济中心城市和现代化国际大都市的重要力量。数据显示,民营经济已成为深圳经济发展的重要引擎,贡献了全市约40%的固定资产...

天味食品拟赴港二次上市 加速全球化战略机会几何?

天味食品拟赴港二次上市 加速全球化战略机会几何?

继登陆A股市场六年后,天味食品(603317.SH)近期披露,公司正筹划发行H股并申请在香港联交所主板上市。 公告表示,此次筹划H股发行上市,旨在进一步推进公司的国际化战略和海外业务布局,更有效地利...

A股、港股重磅!重要指数即将调整!

A股、港股重磅!重要指数即将调整!

多个重要指数的成份股,即将迎来调整! 9月8日,恒生指数成份股调整将正式生效。恒生生物科技指数、恒生综合指数的成份股也有重大调整,所有变动将于9月8日起生效。 另外,根据上交所和中证指数公司此前发布的...

加速AI布局?苹果据悉曾内部讨论收购Perplexity与Mistral

加速AI布局?苹果据悉曾内部讨论收购Perplexity与Mistral

消息称,苹果公司内部曾讨论收购人工智能(AI)初创公司Perplexity与Mistral。 自OpenAI的ChatGPT引发AI潮流以来,苹果在AI领域一直落后于其他科技巨头,这导致华尔街质疑其...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616hnyanshan点击复制并跳转微信