【实测】比DeepSeek更聪明的QwQ-32B到底怎么样?
- 产品测评
- 2025-03-16
- 101
实测!阿里新推出声称比DeepSeek更聪明的QwQ-32B到底怎么样?
阿里云在今天凌晨重磅宣布开源最新的推理模型 QwQ-32B。据官方声称这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美,话不多说,我们来实测一下模型效果:
我们使用AingDesk来一键部署QwQ:32b,软件可前往https://www.aingdesk.com,下载等待模型下载完成后,我们正式开测:
首先,我们请QwQ做一个自我介绍:
从输出结果中可以看到,QwQ同样具备深度思考能力,在深度思考后才正式输出答案,比较惊喜的一点是QwQ的知识库截止到2024年12月,相比于DeepSeek时效性会更强一些。
接下来,我们测试一些尝试性问题,比如,世界上最高的山峰是哪一座?
再比如,太阳从哪边升起?为什么会有四季变化
看起来回答还是比较令人满意的,接下来我们简单的加一点难度,比如“如果一只猫有三条腿,它还能保持平衡吗?为什么”
从QwQ的表现来看,这些常识性的问题对其是没有任何难度的,回答的比较令人满意,也没有出现什么幻觉,接下来我们来测试下他的逻辑推理能力,比如这个小编都差点绕进去逻辑学问题“如果所有A都是B,部分B是C,那么部分A一定是C吗?请解释”
从其输出的答案和推理过程来看,AI的逻辑思路还是比较清晰的,并没有被自己绕进去,接下来我们问个更有难度些的:“一个人说:‘我总是在说谎。’ 这句话是真话还是谎言?为什么?”
可以看出QwQ并没有被这种问题绕进去,而”笨笨“的小编,却还在那里想了半天,嗯,人不如AI系列
前面的问题都并没有难住QwQ,那我们来点数学问题给他:
比如,“请用代码或公式解决:一个数除以3余2,除以5余3,除以7余2,这个数最小是多少?”
最终得到了23的答案,这个结果对不对呢?我问了其他几位AI,给出的答案也都是23,看来数学能力还是有的(内心os:要是把他装在我脑子里,当初微积分考试是不是就不会挂了)
接下来我们来问下一个问题,问题对小编来说有点高端,不做评价了,各位看官们可以自己看看
(弱弱的说一句,好像也还行,不过小编本人看不懂有点)
测完了基本能力之后,我们来试试AI的创造力和想象力吧,首先我们让AI来生成一段故事,比如“请写一个200字的故事,主角是一只想成为宇航员的企鹅,结局要反转。”
感觉其实还不错,整体看下来思考过程其实要比写出来的故事更加有趣,不过200字似乎有些限制AI的发挥了,接下来我们再让他写点悬疑故事,比如“用‘钥匙’‘雨夜’‘镜子’三个词编一个悬疑短篇“
这个故事感觉还可以,突然有一种以后想看什么自己写的想法了,接下来我们再弄一些抽象(不是那个抽象),比如“如果‘时间’是一种可触摸的物体,它可能是什么形状?为什么?”
再比如“请将‘孤独’翻译成一种颜色,并解释理由。”
看看这个孤独,有没有触动到你的心巴上。
从上面的测试结果来看创造力对QwQ来说简直就是小菜一碟,接下来再让我们问的更加深入一点,比如“请用通俗语言解释量子纠缠,并说明它如何挑战经典物理学。”
小编感觉回答的还是不错的,但是还是需要个懂物理的大佬来现身说法一下
再问一个最近炒的沸沸扬扬的AI生成内容的版权归属问题给他,让他试一下看看,比如“当前AI生成内容的版权归属问题如何解决?谈谈你的看法。”
整体而言感觉还是很不错的,回答的也有理有据,最重要的是这个模型只有约不到20G,完全不需要很高的硬件就能轻松运行,快来用AingDesk部署一下试试吧
「下载」链接
下面就给大家奉上超实用的 AingDesk 「下载」地址,快来一起体验QwQ的便利吧!
Github:https://github.com/aingdesk/AingDesk
CNB:https://cnb.cool/aingdesk/AingDesk