从韦氏智商测试来看,假如 o3 的 IQ 真这么高,则称得上十分优良。OpenAI o3 的智商(IQ)居然曾经这么高了吗明天,Reddit 上一则热帖声称「OpenAI o3 的 IQ 估量为 157」,并放出了一张数据图。这象征着什么呢?人类中的 0.0075% 才干到达这个智商程度。更详细地说,每 13,333 团体中才出来一个这么高智商的。对照之下,GPT-4o 的 IQ 为 115、o1 preview 为 123、o1 为 135、o1 pro 为 139、o3 mini 为 141。同样更详细地讲,GPT-4o 每 6 人中有一个、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。这些 IQ 是怎样盘算出来的呢?疑似原作者表现,他依据 Codeforces 编码评级来大略地估量 IQ,并假设报名时竞争顺序员排名前 15%,最后得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 跟 o3 的 IQ 以及在人类中的排名。图源:X@i_dg23此前另有人收拾了 GPT-4o 与 o1 preview、o1、o3 在 2024 年 AIME 数学比赛标题测试(AIME 2024)中的成果,从 13.4 到现在的 96.7,七个月的时光,数学才能实现了奔腾式晋升。图源:X@zbgoodwin仅从以上数据来看,AI 年夜模子的提高速率实在令人震动。不外,究竟残局一张图,o3 的 IQ 真的如表格中那么高吗?有人找到了「Tracking AI」中 o1 在挪威门萨智商测试(Mensa Norway)IQ 测试中的成果(为 133,与下面表格中估量的 135 相差不年夜),必定水平上验证了 o3 估量智商的牢靠性。图源:X@facundo_fagalde图源:https://www.trackingai.org/home因而,将来等 o3 正式宣布当前,它的挪威门萨智商测试成果将愈加值得等待。图源:X@AILeaksAndNewso3 IQ 如斯之高,霎时引爆了各人伙的批评热忱。网友热评有网友直呼:「这张图是我见过最笨拙的货色之一,这些数据基本不克不及代表智商。他们用编码表示的 z 分数代表智商。但编码不是智商测试,尤其是对加入编码测试的 LLM 来说,它们对全部在互联网上分享的代码存在完善的数字影象。o3 乃至无奈解答我 6 岁跟 8 岁的孩子能够解答的成绩。」也就是说,假如 LLM 针对编码测试停止练习,那么用编码表示分数代表智商是毫有意义的。但另一位网友表现:「并非如斯,这是一种基于相干性的『转换』,但起首相干性有点弱,其次它转化为呆板智能的后果尚不明白,即人工智能模子可能善于编码,但在其余范畴却不可。」网友指出:「IQ 自身就是用来评价人类的指标。它评价与智力相干的特定技巧,并天经地义地以为人类应当领有很多其余特点。而这张图经由过程斟酌人工智能能够善于的单一指标来假设狭义智能,他们乃至不应用智商测试来得出这个论断,而是依据与智商相干的指标来揣摸。」总的来说,人们对所谓的「o3 智商高达 157」并不承认。或者,这又是一场炒作吧。参考链接:https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/© THE END 转载请接洽本大众号取得受权投稿或追求报道:
[email protected]
]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->