阿里开源Qwen3,性能强劲
阿里巴巴周一发布并开源通义千问3.0(Qwen3)系列模型。该系列在数学和编程等多方面可与DeepSeek性能媲美,还显著降低了部署成本。Qwen3系列包括两个专家混合 (MoE) 模型和六个其他模型。其中,最新发布的旗舰模型Qwen3-235B-A22B在多项基准测试中极具竞争力。此外,被称为“专家混合”的Qwen3-30B-A3B表现更优,小模型Qwen3-4B也能匹敌Qwen2.5-72B-Instruct的性能。“混合型”模型,独特思考模式
Qwen 3系列是“混合型”模型,有“思考模式”和“非思考模式”。“思考模式”能有效自我事实核查,但推理延迟较高。这种灵活性让用户可根据任务控制模型“思考”程度,两种模式结合增强了“思考预算”控制能力,能在成本效益和推理质量间实现更优平衡。训练数据丰富,便于Agent调用
Qwen3系列支持119种语言,基于近36万亿个token训练,数据量是Qwen2.5的两倍。其训练数据包括教材、问答对等多种内容。预训练分三个阶段,通过改进数据集和扩展上下文长度提升性能。Qwen3在调用工具等方面出色,推荐用Qwen-Agent发挥其Agent能力,它还可通过云服务提供商使用。助力AGI,开源获赞誉
目前阿里巴巴正以Qwen为核心构建AI版图,目标是实现通用人工智能(AGI)。Qwen3是重要里程碑,未来阿里计划从多维度提升模型。阿里Qwen3的发布让AI社区振奋,网友纷纷称赞其性能出色,感谢阿里积极推动开源。转载请注明来自金融资讯网,本文标题:《清晨惊爆!阿里开源Qwen3,集成双思考模式、支持119种语言,Agent调用超便捷!》
还没有评论,来说两句吧...