ChatGPT大升级？它去考研能考上物理所吗？

3月15日本应是小编勤勤恳恳搬砖的平凡一天，但小编刚睡醒就发现朋友圈被ChatGPT刷屏了：

(资料图片)

新版GPT-4震撼发布！

大升级！强到爆炸！

这些字眼引起了我的兴趣，于是小编迅速入(ke)手(jin)了gpt-4，经过简单体验后，小编发现Chatgpt的思维深度确实比之前有了跨越式的提升，高中甚至大一大二的知识根本难不住它，于是小编准备对它进行进一步测试...

如果你还不太了解什么是ChatGPT，可以先看一下我们先前的推送：有人说ChatGPT有物理学博士水平？我们的测试结果令人……

在上一篇推送中我们已经简单测试了ChatGPT的物理水平，但结果并不尽如人意。它仍停留在对物理学一知半解的阶段，很多知识点仅限于知道，稍微深入就开始顾左右而言他，逻辑思维能力有限，但那是之前的gpt-3.5版本。

gpt-4和gpt-3.5在各项考试中的成绩对比

根据官方的宣传，新推出的gpt-4在各项考试中的成绩远超gpt-3.5，在很多专业和学术上的表现达到了人类水平，甚至在GRE(美国研究生入学考试)的两科中已经达到了顶尖大学生水准。

于是小编开始好奇：它能征服GRE，能征服我们物理所的考研题吗？

物理所硕士考试科目

物理所的考研专业课是国科大自主命题。根据往年的情况，专业课单科分数130左右（满分150分）才能有一定把握考上。

题目来源：国科大官网

由于不同专业的考试要求不同，这里我们就以四大力学中最难的量子力学作为基准来考察一下新版Chatgpt的物理水平。至于为什么要选量子力学，因为普物对它已经构不成威胁，测不出它的能力上限，是时候让Chatgpt见识一下真正的力量了！

温馨提示：看不懂也不影响你直接拉到文末看结论。

量子力学第一题

第一问

第一题的三问都是量子力学基础内容，属于送分题，但从这个答案就可以看出ChatGPT是有量子力学功底的：能充分理解我给出的题目，思路清晰正确，加十分！

第二问

本题Chatgpt用的方法很奇怪。因为题目没有给出束缚态的具体形式，也就没有值得讨论的对称性，只能勉强给一点分。

实际上定态下力学量的期望值不随时间改变，具体到位移就是d/dt=0，用海森堡运动方程可以导出

=m*d/dt=0，因此的动量期望为0。

第三问

本题其实只需要将含时薛定谔方程的解代入定态方程，求出其对时间的导数为0就可以，Chatgpt却大费周章地去求含时薛定谔方程的解，实际上这个结论完全可以直接使用。

而且Chatgpt还差临门一脚：证明对时间的导数为0，不过影响不大。

第一题得分：22分。

量子力学第二题

第一问

首先是本征态没问题，但归一化错了。积分的结果应该用delta 函数，否则对1进行全空间积分就是正无穷。但如果我们跟着Chatgpt的错误思路继续做下去，就会看到最后一步化简时AI给出了这样的结果：

这个式子的值应当是1/π。居然会出现这种低级错误，Chatgpt你还是训练的不够啊！

第二问

第二问用泰勒公式就扯远了。本题两个结论之间是厄米共轭的，只需证明其中之一。解题思路是在两项中插入一个完备集，运算后积分即得结论。

第三问

第三问的过程乍一看还是很合理的，公式本身也没错，但AI却套错了公式导致结果错误。正确的公式如下：

第四问

第四问Chatgpt的思路没错，只需要将第三问结果平方就能得到结果，但第四问要用到第三问的结论，所以也跟着错了，大概可以酌情给点思路分。

第二题得分：10分。

量子力学第三题

第一问

来看看Chatgpt对角动量的理解。

看起来Chatgpt并不懂角动量，说了一堆废话以后算出来一个0，正确的解法应该把球坐标代入波函数，然后整理成球谐函数的形式算出角量子数l=1。

如果总角动量为0，第二问的结果直接就是0，就不需要算了。

第二问

果然，Chatgpt废话了一大圈以后还是得出了0，第一问总角动量算错，第二问算分量肯定会算错。

至于第三问，AI废话说到一半就报错了，所以我就不上截图了。

第三题得分：2分。

量子力学第四题

第一问

第一问的解题思路是对的，然而Chatgpt一上来就把哈密顿量给写错了，少了泡利矩阵里的1/2，因此最后的本征值里多了个2，且结果没有归一化，但除此以外都是对的。

第二问

第二问是纯粹的本征值计算问题，Chatgpt的思路非常标准，前期计算也是正确的，但最后算行列式时直接把两个2c_0给扔掉了，导致两个能级结果错误。虽然没能全对，能做到这一步已经很厉害了。

第四题得分：25分

量子力学第五题

第一问

第一问是送分题，只要把定态的动量和位移的不确定度代入不确定性关系，由a^2+b^2≥2ab就可以导出最小值，Chatgpt的思路虽然复杂了点，但也没问题，然而它又又又又算错了：

但我们稍加计算就能看出这里的化简结果应当是：

第二问

第二问变分法，Chatgpt一上来就把归一化常数算错了：

但人类也会犯这种低级错误

很明显，这里AI把平方漏掉了，导致后续计算全部错误。不过AI给出的过程很标准，条理清晰，值得学习。

第三问

本题直接套升降算符的性质：a_- |0>=0，|1>=a_+ |0>，由第一个式子确定基态波函数，再用第二个式子算出第一激发态。AI用的也是这个思路，但在下面这一步求导的时候算错了。

第四问

题目已经给出了微扰的矩阵形式，直接算特征值就可以解决问题，但Chatgpt又把简单的行列式算错了，算出了1*1=2的惊天妙手：

正确的久期方程应该是-λ^3+λ=0，而不是其给出的-λ^3+2λ=0。由久期方程解出0和±1三个特征值，因此在微扰下三重简并消除，能级分裂成与特征值一一对应的三个。

第五题总分:18分。

ChatGPT总得分：77分/150分，距离130分的目标还有亿点差距，建议第二年再战哦！

此外，我还让Chatgpt做了2021年的国科大量子力学考研题，它也拿到了约80分，而且如果能帮它稍微修正一下计算过程中的错误，就能达到约100分水平。毫不夸张地说，Chatgpt的量子力学已经达到了物理系本科毕业生水平。

文献总结

为了进一步测试gpt-4的学术能力，我又找了一篇文献来测试gpt-4的文献阅读能力，下面是一段由其生成的文献内容总结。

论文链接

Chatgpt翻译总结的错误较多，比如温度的单位mK被翻译成了毫克，也无法理解一些学术名词，比如1K池（4He-1K-stage）被翻译成了1K级，不认识卡皮查热阻等，参考价值有限。看来学术名词翻译即使对AI来说也不是一件容易的事。

但如果让Chatgpt以英文输出，则其总结文献内容的能力十分强大，语言流畅逻辑清晰，不过仍会遗漏一些重要信息，所以还不能依赖AI来看文献。

目前将论文输入Chatgpt比较麻烦，很多时候不如直接看摘要，尚不能为我们阅读文献提供实质性的帮助。如果后续能根据图片或者pdf直接给出主要内容，将是其能力的又一次飞跃。

新旧版本对比

最后我又对比了一下gpt-3.5和gpt-4的量子力学能力。面对一维谐振子问题，gpt-4能完美解决，但gpt-3.5就不行。

测试内容相关来源：窝湖边的

不过，面对更复杂的场论中氢原子狄拉克方程与精细结构问题，即使是gpt-4也无能为力，只能在说了一堆废话后报错，看来场论的难度已经超过了它的能力上限。综合来看，gpt-3.5对量子力学仅有大概了解，但gpt-4对量子力学有着深入的了解，水平远超gpt-3.5。

gpt-3.5和gpt-4的对比，第一张截图是gpt-3.5，后三张是gpt-4。

总结

经过测试，gpt-4对量子力学的理解相当深入。它解题的思路清晰准确，但计算能力较差。由于语言模型底层逻辑的限制，它在解题过程中总是犯低级计算错误，因此拿不到高分，也就考不上物理所。但我认为它的总分过国家线不成问题。

虽然ChatGPT很难考上物理所，但它的量子力学水平已经接近物理专业的本科毕业生（计算能力除外），令人不得不承认它的强大。不仅如此，从小学中学到本科的题目都可以让ChatGPT来解，其不但能提供详细的思路和过程，还能针对你提出的问题加以讲解，善加运用完全可以成为学生的好帮手。

最后，欢迎大家报考中科院物理所哦！

注1：ChatGPT网页端目前未开放图片输入，本文并非以图片，而是以输入符号文字的形式来向ChatGPT提问的。展示的题目图片是为了方便读者阅读。

注2：小编没有考研经验，给分比较随意，本文不构成任何考研建议。

编辑：黄水机

推荐内容

ChatGPT大升级？它去考研能考上物理所吗？

【新要闻】理想L7是L8六座改五座？理想汽车：完全不是

今日热议：再度刷屏的“室温超导”靠谱不？不日见分晓

零百加速1.9s 中国第一超跑埃安Hyper SSR量产已达50%

今日聚焦!2028年左右建成 中国月球科研站选址南极：初定5大目标

当前要闻：12万买宝马1系、22万提奥迪A6？探访车企降价浪潮背后的虚与实

快播：开过电车就回不去了？博主：开特斯拉没电真回不去家了

当前速递！突破！中国科学家发现两种新矿物

宁德时代赴瑞士上市或被推迟 原计划募资至少50亿美元

观天下！马斯克要赔数亿美元？特斯拉遭车主集体起诉：垄断维修市场

每日热闻!扣上的安全带会自动打开？本田在美国召回近45万辆汽车

中国计划2023年底发射爱因斯坦探针 探索变幻莫测的宇宙

即时：探秘红细胞“折叠大法” 为体外造血铺路

天天动态:NASA发布新一代登月太空服 2025重返月球就穿它

传统后视镜的自白：2023年 我终于要退休了

特斯拉回应压到石子维修需花14万：都是明码标价

【时快讯】东风系“掀桌子”自救 二手车商狂甩库存

小牛NQi电动车充电自燃烧成废铁 家具烧没 消防：电池故障

环球快资讯丨真不用羡慕油车了！特斯了V4超级充电桩落地：最高功率350kW

焦点精选！研究：睡眠不足6小时将降低流感、甲肝等疫苗接种效果

小偷欲偷走老式赛车 但因驾驶手动挡技术不佳未能成功

今日聚焦!充电慢、续航差、反馈无门！bZ4X首批车主公开致信广汽丰田董事长

世界速递！中国矿业大学90后校友回应“捐款门”：因炒比特币合约亏损严重

当前聚焦：等等党狂喜？摩根士丹利：特斯拉在中国市场必须进一步降价

马斯克：SpaceX星际飞船第一次轨道试飞将会有50%的成功率

中国基础研究支出曝光：超预算还是不足？

最资讯丨“DS-8201”效应：中国创新药飓风将起

全球速看：钠电池的果子 就要熟了

焦点消息！一“蹄”难定江湖，巨亏下的蔚来未来何来？

汽车价保，该普及吗？

【全球播资讯】降价救得了东风吗？

天天快资讯：蔡老板上诉特斯拉二审维持原判 蔡老板需向特斯拉赔偿侵权损失1万元

速递！印度将与俄罗斯开展火星探索新任务 共同开发无人机Marsoplane

月球定居第一步：月亮上几点了？

市场监管总局：2022年接收新能源汽车投诉举报1.6万件 同比增长62.84%

App存BUG？一男子误解锁他人特斯拉Model 3并成功开走

环球微速讯：欧洲定了个小目标：2040年载人登陆火星 不靠美国

世界今热点：马斯克“减肥神药”遭疯抢！欧洲药管局就短缺问题发出警告

当前资讯!“穿红舞鞋”的比亚迪 不能停止跳舞

天天速读：动力电池降价内卷 这次不一样

哈佛大学研究：体力劳动更多的男性生育能力更强

不得不防！气候变化或致更多“僵尸病毒”被唤醒

世界速讯：燃油车“杀疯了”？其实是逼疯了

环球热消息：长二丙成功发射荷鲁斯2号卫星

环球速看：紫金山天文台提前两周预警30米级近地小行星飞掠地月系统

环球动态:理想推用户购车价格保护权益 李想曾称不会降价

天天最资讯丨中国自主研制的太赫兹探测设备在南极成功运行

2023款比亚迪海豹申报信息曝光 动力调整售价或降低

全球新动态：俄罗斯成功使用质子-M火箭发射Olymp-K №2卫星

快看：众车企参与降价乱战 比亚迪赵长江：促销潮是淘汰落后产能

在我国内蒙古宁城县 发现1.25亿年前“宁城中华草”

土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏

我国车联网产业发展进入快车道，智能网联汽车数量快速增加

腾讯与奥迪宣布达成战略合作，“微信车载版”上线

“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力

自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持

半导体厂商一季度业绩向好，国产替代进程加速

据预测：2025年，全球卫星网络接入设备将达2亿台套

我国海上风电总装机容量仅次于英国，位居第二

里程碑式突破！揭示高能宇宙线起源之谜

青海省开启“集控站+无人值守”运维新模式 提高设备运行水平

安徽首个量子计算芯片联合实验室成立 打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆 聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域 达世界先领先水平

加快推进“双千兆”网络建设，聚焦网络质量提升

英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%

2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办

ASO-S“探日”有望于2022年发射升空！探索太阳磁场

超高速互联网将普及计算 助力缩小数字鸿沟

1至2月，我国规模以上互联网企业完成业务收入同比增长达29%

数字化转型找准“方向感”，打造国内商业数字化发展高地

加快5G网络规模化部署，打造数字经济新优势

探索5G行业融合应用 5G专网将进一步推动融合应用发展

中国移动香港5G商用一周年 开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞 或解释对于其他黑洞族演化的影响

7709米！哈工程“悟空”号创中国AUV潜深新纪录

人工智能领域新算法发布 数据传输更高效精准

科技创新技术加持，我国船舶制造已达到世界前列

我国5G网络要坚持适度超前原则，探索5G应用发展

今日聚焦!2028年左右建成中国月球科研站选址南极：初定5大目标

宁德时代赴瑞士上市或被推迟原计划募资至少50亿美元

中国计划2023年底发射爱因斯坦探针探索变幻莫测的宇宙

传统后视镜的自白：2023年我终于要退休了

【时快讯】东风系“掀桌子”自救二手车商狂甩库存

小牛NQi电动车充电自燃烧成废铁家具烧没消防：电池故障

小偷欲偷走老式赛车但因驾驶手动挡技术不佳未能成功

全球速看：钠电池的果子就要熟了

天天快资讯：蔡老板上诉特斯拉二审维持原判蔡老板需向特斯拉赔偿侵权损失1万元

速递！印度将与俄罗斯开展火星探索新任务共同开发无人机Marsoplane

市场监管总局：2022年接收新能源汽车投诉举报1.6万件同比增长62.84%

环球微速讯：欧洲定了个小目标：2040年载人登陆火星不靠美国

当前资讯!“穿红舞鞋”的比亚迪不能停止跳舞

天天速读：动力电池降价内卷这次不一样

环球动态:理想推用户购车价格保护权益李想曾称不会降价

2023款比亚迪海豹申报信息曝光动力调整售价或降低

快看：众车企参与降价乱战比亚迪赵长江：促销潮是淘汰落后产能

在我国内蒙古宁城县发现1.25亿年前“宁城中华草”

青海省开启“集控站+无人值守”运维新模式提高设备运行水平

安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”

航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合

我国活体组织成像技术干细胞研究应用领域达世界先领先水平

超高速互联网将普及计算助力缩小数字鸿沟

中国移动香港5G商用一周年开拓5G商业场景应用

早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响

人工智能领域新算法发布数据传输更高效精准

小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?

科技助力智能生活垃圾分类投放点全新亮相

“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布

《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布

LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统

腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价

苹果文档曝光：新一代Apple TV将发布配置大幅升级

在线办公平台用户规模增长迅猛新型“无纸化”工作方式成为热潮

南京智能网联汽车先导区建设启动发布南京制造业2.0版新政策

一键接入贵州信息通信业全力推进适老化服务

信创产业正在迎来发展黄金期统信软件加快与主流芯片厂商合作

打破“只租不卖”的共享出行模式哈啰推自研智能两轮电动车

由于芯片短缺现代已经暂停IONIQ 5等电动车生产

小米宣布将于明天举行小米影像品鉴会聊聊小米影像

大众将为MEB平台加载V2G技术稳定可再生能源的波动供应

三星Galaxy Quantum 2首批谍照曝光黑色和白色

B站否认商谈收购游族网络 24% 股权及总部大楼游族网络直线拉升

消息称苹果因供应紧缺推迟MacBook和 iPad 生产苹果拒绝置评

小米电视及Redmi电视部分产品型号宣布涨价新机价格平均上涨 5-10%

小米 11 Ultra于4月8日海外开售，售价 5999 元起

联想拯救者电竞手机2 Pro正式预热拥有更出色的散热设计

微软Surface Laptop 4页面泄露将有英特尔和 AMD 两个版本

外星人推出M15 R5游戏本内含外星人高端外设

E Ink推出Spectra 3100电子纸扩大电子价签与零售广告牌应用

微信iOS版8.0.4正式版正式发布表情包上限提升到了 999 个

暴雪《暗黑破坏神 2 重制版》将开启限时技术测试持续到 4 月 12 日

2021中国（北京）国际游乐设施设备博览会在京开幕深圳市维亚环球科技有限公司受邀参加，并取得圆满成功

深入实施制造强国战略以四个方向加强制造业发展

我国神州十二号载人飞船成功发射中国人首次进入自己的空间站

我国研发人员总量连续多年居世界首位科技领军人才从哪里来？

如何打造一部更好的车？需要高性能计算平台支撑

重大科技电子枪顺利完成安装工程建设正式进入设备安装阶段