小戴先生
Login

QwQ-32B: 媲美DeepSeek 671B的推理模型

QwQ 是Qwen系列最新的推理模型,相比传统指令调优模型,具备思考和推理能力的 QwQ 在下游任务尤其是难题上的表现可大幅提升。QwQ-32B 是中型推理模型,能够与 DeepSeek-R1、o1-mini 等最先进的推理模型媲美。

QwQ 32B 模型具有以下特点:
- 类型:因果语言模型
- 开放权重时间:2024年3月5日
- 训练阶段:预训练和后训练(监督微调和强化学习)
- 架构:具有 RoPE、SwiGLU、RMSNorm 和 Attention QKV 偏差的转换器
- 参数数量:32.5B
- 参数数量(非嵌入):31.0B
- 层数:64
- 注意头 (GQA) 数量:Q 为 40 个,KV 为 8 个
-上下文长度:完整的 131,072 个 token

戴尔的QwQ适配机型

选购以下产品,用低得多的预算,获得和满血版DeepSeek相当的推理能力。

QwQ-32B

ALWM16-R2963QB外星人

ALWM16-R2963QB外星人

Core i9-13900HX, 32G内存,512G固态,RTX4060 8G显卡,2.5K 120Hz

外星人,带NPU的Ultra7处理器,RTX4060显卡,32G大内存,性能强劲,高分高刷大屏

G16-7630-R1969W游戏本

G16-7630-R1969W游戏本

Core i9-13900HX, 32G内存,RTX4070 8G显卡,2.5K 240Hz

高性能游戏本,标压i9处理器+RTX4070显卡,32G大内存,性能强劲,高刷大屏

DB14250-R2808S轻薄本

DB14250-R2808S轻薄本

Ultra7-258v, 32G内存,1T固态,2.5K 90Hz

高性能轻薄本,英特尔Lunar Lake处理器,调整上下文长度后可运行QWQ:32B

DB16250-R2808S轻薄本

DB16250-R2808S轻薄本

Ultra7-258v, 32G内存,1T固态,2.5K 120Hz

高性能轻薄本,英特尔Lunar Lake处理器,调整上下文长度后可运行QWQ:32B

Precision 3680工作站

Precision 3680工作站

Core i7-14700, 可选64G~128G内存,RTX 5880 Ada 48G显卡

专业工作站,搭载RTX5880Ada显卡,三分区散热,导流罩设计,性能之选

Precision 5680工作站

Precision 5680工作站

至强W2455X, 可选64G~2T内存,2xRTX 4500 Ada 24G显卡

专业工作站,至强处理器,两张RTX4500Ada显卡,四风道散热,导流罩设计,性能之选

Precision 7960工作站

Precision 7960工作站

至强W3455, 可选256G~4T内存,1~4张 RTX 5880 Ada 48G显卡

顶级工作站,至强处理器,RTX5880Ada显卡,双区五通道散热,支持高并发

小戴先生

这是一个协助您在戴尔电脑上安装AI的工具,我们尝试根据您电脑的配置来选择合适的AI软件。 在安装前,请确认您的机型和配置以便我们准确推荐。