当前位置:首页 > 产品测评 > 正文

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?

实测!阿里新推出声称比DeepSeek更聪明的QwQ-32B到底怎么样?



阿里云在今天凌晨重磅宣布开源最新的推理模型 QwQ-32B。据官方声称这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美,话不多说,我们来实测一下模型效果:

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第1张

我们使用AingDesk来一键部署QwQ:32b,软件可前往https://www.aingdesk.com,下载等待模型下载完成后,我们正式开测:


基础能力测试

首先,我们请QwQ做一个自我介绍:

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第2张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第3张

从输出结果中可以看到,QwQ同样具备深度思考能力,在深度思考后才正式输出答案,比较惊喜的一点是QwQ的知识库截止到2024年12月,相比于DeepSeek时效性会更强一些。

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第4张

接下来,我们测试一些尝试性问题,比如,世界上最高的山峰是哪一座?

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第5张

再比如,太阳从哪边升起?为什么会有四季变化

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第6张

看起来回答还是比较令人满意的,接下来我们简单的加一点难度,比如“如果一只猫有三条腿,它还能保持平衡吗?为什么”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第7张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第8张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第9张

从QwQ的表现来看,这些常识性的问题对其是没有任何难度的,回答的比较令人满意,也没有出现什么幻觉,接下来我们来测试下他的逻辑推理能力,比如这个小编都差点绕进去逻辑学问题“如果所有A都是B,部分B是C,那么部分A一定是C吗?请解释”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第10张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第11张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第12张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第13张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第14张

从其输出的答案和推理过程来看,AI的逻辑思路还是比较清晰的,并没有被自己绕进去,接下来我们问个更有难度些的:“一个人说:‘我总是在说谎。’ 这句话是真话还是谎言?为什么?

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第15张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第16张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第17张

可以看出QwQ并没有被这种问题绕进去,而”笨笨“的小编,却还在那里想了半天,嗯,人不如AI系列【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第18张

前面的问题都并没有难住QwQ,那我们来点数学问题给他:

比如,“请用代码或公式解决:一个数除以3余2,除以5余3,除以7余2,这个数最小是多少?”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第19张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第20张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第21张

最终得到了23的答案,这个结果对不对呢?我问了其他几位AI,给出的答案也都是23,看来数学能力还是有的(内心os:要是把他装在我脑子里,当初微积分考试是不是就不会挂了【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第22张

接下来我们来问下一个问题,问题对小编来说有点高端,不做评价了,各位看官们可以自己看看【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第23张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第24张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第25张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第26张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第27张

(弱弱的说一句,好像也还行,不过小编本人看不懂有点【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第28张


创造力与想象力

测完了基本能力之后,我们来试试AI的创造力和想象力吧,首先我们让AI来生成一段故事,比如“请写一个200字的故事,主角是一只想成为宇航员的企鹅,结局要反转。”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第29张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第30张

感觉其实还不错,整体看下来思考过程其实要比写出来的故事更加有趣,不过200字似乎有些限制AI的发挥了,接下来我们再让他写点悬疑故事,比如“用‘钥匙’‘雨夜’‘镜子’三个词编一个悬疑短篇“

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第31张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第32张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第33张

这个故事感觉还可以,突然有一种以后想看什么自己写的想法了【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第34张,接下来我们再弄一些抽象(不是那个抽象),比如“如果‘时间’是一种可触摸的物体,它可能是什么形状?为什么?”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第35张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第36张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第37张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第38张

再比如“请将‘孤独’翻译成一种颜色,并解释理由。”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第39张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第40张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第41张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第42张

看看这个孤独,有没有触动到你的心巴上。


领域深度测试

从上面的测试结果来看创造力对QwQ来说简直就是小菜一碟,接下来再让我们问的更加深入一点,比如“请用通俗语言解释量子纠缠,并说明它如何挑战经典物理学。”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第43张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第44张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第45张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第46张

小编感觉回答的还是不错的,但是还是需要个懂物理的大佬来现身说法一下【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第47张

再问一个最近炒的沸沸扬扬的AI生成内容的版权归属问题给他,让他试一下看看,比如“当前AI生成内容的版权归属问题如何解决?谈谈你的看法。”

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第48张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第49张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第50张

【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?  第51张

整体而言感觉还是很不错的,回答的也有理有据,最重要的是这个模型只有约不到20G,完全不需要很高的硬件就能轻松运行,快来用AingDesk部署一下试试吧

「下载」链接


下面就给大家奉上超实用的 AingDesk 「下载」地址,快来一起体验QwQ的便利吧!

AingDesk官网:https://www.aingdesk.com/zh/
开源地址:

Github:https://github.com/aingdesk/AingDesk

CNB:https://cnb.cool/aingdesk/AingDesk