QwQ-32B: 媲美DeepSeek 671B的推理模型
QwQ 是Qwen系列最新的推理模型,相比传统指令调优模型,具备思考和推理能力的 QwQ 在下游任务尤其是难题上的表现可大幅提升。QwQ-32B 是中型推理模型,能够与 DeepSeek-R1、o1-mini 等最先进的推理模型媲美。

QwQ 32B 模型具有以下特点:
- 类型:因果语言模型
- 开放权重时间:2024年3月5日
- 训练阶段:预训练和后训练(监督微调和强化学习)
- 架构:具有 RoPE、SwiGLU、RMSNorm 和 Attention QKV 偏差的转换器
- 参数数量:32.5B
- 参数数量(非嵌入):31.0B
- 层数:64
- 注意头 (GQA) 数量:Q 为 40 个,KV 为 8 个
-上下文长度:完整的 131,072 个 token
戴尔的QwQ适配机型
选购以下产品,用低得多的预算,获得和满血版DeepSeek相当的推理能力。
QwQ-32B

ALWM16-R2963QB外星人
外星人,带NPU的Ultra7处理器,RTX4060显卡,32G大内存,性能强劲,高分高刷大屏

G16-7630-R1969W游戏本
高性能游戏本,标压i9处理器+RTX4070显卡,32G大内存,性能强劲,高刷大屏

DB14250-R2808S轻薄本
高性能轻薄本,英特尔Lunar Lake处理器,调整上下文长度后可运行QWQ:32B

DB16250-R2808S轻薄本
高性能轻薄本,英特尔Lunar Lake处理器,调整上下文长度后可运行QWQ:32B

Precision 3680工作站
专业工作站,搭载RTX5880Ada显卡,三分区散热,导流罩设计,性能之选

Precision 5680工作站
专业工作站,至强处理器,两张RTX4500Ada显卡,四风道散热,导流罩设计,性能之选

Precision 7960工作站
顶级工作站,至强处理器,RTX5880Ada显卡,双区五通道散热,支持高并发