清晨惊爆！阿里开源Qwen3，集成双思考模式、支持119种语言，Agent调用超便捷！

马克·理查德森二世 2025-04-29 育儿 3 次浏览 0个评论

阿里开源Qwen3，性能强劲

阿里巴巴周一发布并开源通义千问3.0（Qwen3）系列模型。该系列在数学和编程等多方面可与DeepSeek性能媲美，还显著降低了部署成本。Qwen3系列包括两个专家混合 (MoE) 模型和六个其他模型。其中，最新发布的旗舰模型Qwen3-235B-A22B在多项基准测试中极具竞争力。此外，被称为“专家混合”的Qwen3-30B-A3B表现更优，小模型Qwen3-4B也能匹敌Qwen2.5-72B-Instruct的性能。

“混合型”模型，独特思考模式

Qwen 3系列是“混合型”模型，有“思考模式”和“非思考模式”。“思考模式”能有效自我事实核查，但推理延迟较高。这种灵活性让用户可根据任务控制模型“思考”程度，两种模式结合增强了“思考预算”控制能力，能在成本效益和推理质量间实现更优平衡。

训练数据丰富，便于Agent调用

Qwen3系列支持119种语言，基于近36万亿个token训练，数据量是Qwen2.5的两倍。其训练数据包括教材、问答对等多种内容。预训练分三个阶段，通过改进数据集和扩展上下文长度提升性能。Qwen3在调用工具等方面出色，推荐用Qwen-Agent发挥其Agent能力，它还可通过云服务提供商使用。