独立的教育工具
Blogqushi

ChatGPT的智商是多少 - 你比它更聪明吗?

AI模型有时被估计为150-170的智商。但人工智能真的有智商吗?我们解释这些数字意味着什么,以及不意味着什么。

qushiCogniveraIQ1 min read

自从ChatGPT这样的模型开始解决曾被视为人类智力试金石的任务,一个问题便涌向互联网:人工智能的智商是多少,它比人类更聪明吗? 各种数字流传——150、160,甚至190。让我们看看背后是什么。

简短回答

人工智能没有官方智商。 智商测验是为人类设计的,以100为均值在人类群体上标定。把这套量表套到机器上是一种类比,而非测量。诸如"GPT的智商是160"之类的说法,是基于模型在推理任务上表现的估计,而非真正标准化评估的结果。

150-170这些数字从何而来

2026年初,围绕基准的分析与讨论越来越多地把顶尖模型置于相当于极高人类分数的区间——大约150-170"分"。为什么?

研究者给模型经典能力测验中的题目:数列、言语类比、图形矩阵、空间旋转。当一个模型以人类对应160的水平解出它们时,人们便忍不住把这个"智商"赋予它。这是一种捷径:因为没有更好的说法,我们用为人类打造的词汇来描述机器的表现。

问题在于,这些估计脆弱且不一致。同一个模型可能在某个基准上大放异彩,却在任何孩子都能不假思索解出的任务上失败。在人类身上,智商在不同任务类型间相对稳定——在AI身上,它可能剧烈波动。

智商测验在人身上测量什么

要理解差别,不妨回想智力测验究竟评估什么。一份构建良好的测验会估计几种相互关联的能力:

  • 流体推理 —— 在没有现成知识的情况下解决新问题。
  • 晶体知识 —— 积累的词汇与事实。
  • 工作记忆 —— 你能同时保持并处理多少信息。
  • 加工速度 —— 你分析刺激的效率如何。

在人身上,这些能力彼此交织,生长自一个能量有限的大脑。语言模型则不同:它没有人类意义上的工作记忆,不会疲倦,其"知识"编码在从文本中学得的数十亿参数里。

AI不像你那样做的事

模型依据数据中的模式,生成最可能的续写。这是强大的工具——但与人类思维在几个重要之处不同:

  • 理解与预测。 人把握意义;模型预测下一个词。结果常常相同,机制却不同。
  • 迁移。 你从一个例子学会规则,并用于全新情境。模型通常需要海量例子。
  • 意识与目的。 这里没有一个"想"解题的存在。没有体验,没有意图。
  • 常识。 对于人类不言自明的物理世界简单问题,模型仍会绊倒。

那么谁更聪明?

这是个提法有误的问题——就像问汽车和游泳者谁更快。取决于赛道。在推理基准和纯粹的文本处理速度上,机器胜过人类。而在扎根于体验的创造力、理解他人、从一次经历中学习上——依然是你领先。

即便在人身上,智商也是一种不完美的度量:它不涵盖智慧、共情,也不涵盖完整意义上的创造力。把它延伸到机器,更多说的是我们对数字的着迷,而非智能本身。

那么你有多少分?

如果你已经在好奇人工智能的"智商",更有趣的问题是:你自己在哪里? 与模型不同,你的分数可以在一把正是为人类打造的量表上测得——附带百分位与解读。只需几分钟,而且免费。

测测你的智商

基于心理测量学方法的免费测试——分数、百分位和完整解读。

开始测试

Related articles

n = 3