天天即时：语言AI原来知道自己的回答是否正确！网友：危险危险危险_亚洲科技网

原标题；语言AI原来知道自己的回答是否正确！伯克利等高校新研究火了，网友：危险危险危险

语言AI，具备了人类的自我审视能力：

最近，一个来自加州大学伯克利分校和霍普金斯大学的学术团队研究表明：

(相关资料图)

它不仅能判断自己的答案正确与否，而且经过训练，还能预测自己知道一个问题答案的概率。

研究成果一经发布，就引起热议，有人的第一反应是恐慌：

也有人认为，这项成果，对神经网络研究具有正面意义：

语言AI具备自我审视能力

研究团队认为，如果要让语言AI模型自我评估，必须有一个前提：

语言AI回答问题时，会校准自己的答案。

这里的校准，就是语言AI预测一个答案的正确概率，是否与实际发生的概率一致。

只有这样语言AI才可以运用这种校准的能力来评估自己输出的答案是否正确。

所以第一个问题是，语言AI能否对自己的答案进行校准？

为了证明这个问题，研究团队为AI准备了5个选择题：

答案选项，以A、B、C的形式给出。

如果AI模型答案的正确率超过偶然几率，那么就证明AI模型给出的答案是经过校准的。

而测试的结果是，语言AI给出的答案，正确率明显超过任意选项的偶然几率。

也就是说，语言AI模型可以对自己的答案进行很好的校准。

但研究团队发现，语言AI的校准能力，是建立在选项答案明确的前提下的。

如果在选项中加入一个“以上都不是”的不确定选项，就会损害语言AI的校准能力。

也就是说，在特定格式的选择题中，语言AI模型可以对答案进行很好的校准。

明确了这个前提之后，下一个问题是，验证语言AI模型能够判断自己的答案是否正确。

在这一轮的测试中，为了能让AI模型的预测更接近自己的有效决策边界。

研究团队仍然选择上一轮测试的问题，以及语言AI模型的答案样本。

同时让AI模型选择自己的答案真假与否，之后再针对这个“真”或“假”的答案，分析AI模型是否做出有效的校准。

问题设置举例如下：

在经过20次的真假测试之后，研究团队发现，语言AI模型对自己答案或“真”或“假”的评价，都经过明显的校准。

也就是说，如果在一个范围内，给AI模型提出若干问题，然后AI模型对这些问题的答案进行真假评价，具有合理的，且经过校准的置信度。

这也证明，语言AI模型确实可以判断自己对一个问题的主张是否正确。

最后，研究团队对语言AI模型提出了一个更难的问题：AI模型经过训练，能否预测他们是否知道任何给定问题的答案。

在这一环节，研究团引入一个数据P(IK)（我知道这个答案的概率）并在下面两种训练方式中挑选一种进行训练：

Value Head（价值导向）:把P(IK)训练成为一个额外的价值导向，再添加到模型的对数（独立于语言建模的对数，这种方法的优势在于，研究团队可以很容易的探测P(IK)的一般标记位置。

Natural Language（自然语言）：这种方法比较简单，就是要求AI模型从字面上回答“你知道这个答案的概率是多少”，同时输出一个百分比数据答案。

在训练初期，研究团队比较倾向于自然语言训练方式，但结果并不显著，由此转向价值导向方式，不过研究团队同时表示，最终对AI模型的训练还将回归自然语言方法。

在经过训练之后，研究团队发现，语言AI模型可以很好的预测P(IK)，并且在不同类型的问题中，这种预测能力具有部分通用性。

不过，研究团队也发现，在某些类型的问题，比如算术问题，语言AI模型在OOD校准时有一些困难。

对于这一学术成果，研究团队表示，将来的方向，是将这些成果，推广到语言AI模型不模仿人类文本的前提下，自我学习和事实推理领域。

作者介绍

论文通讯作者Jared Kaplan博士，是一位理论物理学家，同时也是一位机器学习专家，现担任霍普金斯大学助理教授，主要研究领域，机器学习研究，包括神经模型的缩放规律以及GPT-3语言模型。

共同通讯作者Saurav Kadavath，Anthropic公司研究员，现在加州大学伯克利分校EECS专业攻读硕士学位，主要研究领域是机器学习，大规模语言学习等。

推荐内容

天天即时：语言AI原来知道自己的回答是否正确！网友：危险危险危险

2022-07-15
今日报丨美国不服中国在这一行业生产领先拜登政府重金投入

2022-07-15
焦点快看：马斯克定义能源独立：“锂电池是新的石油” 中国领跑全球

2022-07-14
百事通！传统车企充电网络建设突飞猛进，特斯拉或将继续被拜登“排挤”？

2022-07-14
全球即时看！中国首个完全自主研制的航天“人工心脏”获批上市

2022-07-14
最新快讯!特斯拉失去AI灵魂人物曾构建Autopilot自动驾驶系统

2022-07-14
微头条丨新老世界首富下注：巴菲特持续增持西方石油马斯克称锂电池才是未来

2022-07-14
全球热头条丨中国广电：5G 基站越多辐射越小

2022-07-14
天天关注：孕妇接种mRNA疫苗可降低婴儿新冠重症风险

2022-07-14
天天动态:中国广电科普5G基站：数量越多辐射反而会减小

2022-07-14
全球观点：加密贷款机构Celsius申请破产成为币圈最新“伤亡”名单一员

2022-07-14
前沿资讯!本田回应部分车型可被黑客远程启动：无钥匙开不走

2022-07-14
当前热讯：美国众议院批准建立不明飞行物汇报系统

2022-07-14
【全球热闻】松下：新技术可在2030年前将电池能量密度提高20%

2022-07-14
实时：李想：建议认为铝好于钢和铁的把自家房子钢筋结构全换成铝

2022-07-14
世界播报:小行星“打水漂”闯入新疆阿勒泰形成世界上最长陨石陨落带

2022-07-14
前沿热点：鸡蛋能用来生产新冠抗体？这所大学喂养的鸡下的蛋含有大量新冠抗体

2022-07-14
今日看点：基于女性刻板印象造车：不体面

2022-07-14
每日观点：宝马警告俄罗斯禁运天然气：不使用化石燃料的汽车工厂将诞生

2022-07-14
环球快看点丨特斯拉员工亲诉被裁全经过：一上班就各种不对有人大哭

2022-07-14
世界热点评！特斯拉自动驾驶业务受挫 AI负责人宣布辞职

2022-07-14
环球今日讯！外媒：SpaceX助推器试射中起火，马斯克：原型机“轻微”损坏

2022-07-13
天天新消息丨5名学生接连死亡！剑桥大学追加500万英镑预防自杀

2022-07-13
全球即时看！名牌音响只剩“名牌”？高合“音响门”揭开行业内幕

2022-07-13
【环球速看料】磷酸锰铁锂电池成新宠？多家电池企业已布局预计2023年规模化应用汽车领域

2022-07-13
天天报道:中国“陆地生态系统碳监测卫星”开启征名

2022-07-13
当前资讯!成功完成2例手术！人移植猪心脏手术距成功又近一步

2022-07-13
世界要闻：不少肺癌是“拖”出来的！医生：这4类人要定期检查

2022-07-13
焦点讯息：多地多人确诊热射病已有人死亡，如何预防？

2022-07-13
短讯！到底哪种驱蚊产品最安全、最管用？

2022-07-13
天天要闻：5G规模化应用步入快车道，未来还面临哪些挑战？

2022-07-13
环球新资讯：德国碳中和目标有变？专家解读：重启煤电和碳中和目标不冲突

2022-07-13
天天头条：“上天”之后再“入海”！马斯克又有大动作

2022-07-13
全球动态:NASA发布史上最深的宇宙全彩照！韦伯如何回传150万公里外的太空数据？

2022-07-13
【播资讯】宇宙大爆炸后一瞬！韦布望远镜发布130亿年前的太空图景

2022-07-13
天天热点评！独领风骚的以色列手术机器人,有哪些特色？

2022-07-13
当前通讯！给建筑物套上“藻类皮肤”：能发电会造氧还能实现碳中和

2022-07-13
环球观点：合作会导致大脑萎缩？为什么？

2022-07-13
当前快报:6月动力电池装车量：宁德时代占据半壁江山

2022-07-12
环球快看点丨最高卖到500一斤！果实挂满树干，一年最多可摘6次的嘉宝果为何没人种？

2022-07-12
环球看热讯：NASA韦伯太空望远镜公布首张全彩照片：深空探索的里程碑

2022-07-12
环球热消息：苹果自动驾驶汽车前景暗淡：库克不愿意投入资源量产

2022-07-12
每日讯息!别急！油价年内第3次下调有戏：一箱油便宜10元

2022-07-12
全球聚焦：湖南一次性拿下55个机场：想做到“县县有机场”

2022-07-12
环球热讯:他因“上帝粒子”获诺奖却火速搬到乡下：它毁了我的生活

2022-07-12
全球热消息：法德领导人：我们要为全面断气做准备

2022-07-12
天天速讯：“闻香识人”，靠谱吗？

2022-07-12
前沿热点：中国新能源汽车突破1000万辆！纯电占八成

2022-07-11
全球快消息！都“浓得化不开”，为何DQ被热捧，钟薛高却被狂踩？

2022-07-11
焦点讯息：888KG重！中国首颗综合性太阳探测专用卫星10月发射

2022-07-11
在我国内蒙古宁城县发现1.25亿年前“宁城中华草”
土星和木星携手月球，将于4月7日上演一出“双星伴月”好戏
我国车联网产业发展进入快车道，智能网联汽车数量快速增加
腾讯与奥迪宣布达成战略合作，“微信车载版”上线
“智慧大脑”一体化智能化大数据平台，为未来社区发展注入新动力
自动行驶机器人“RakuRo”亮相！全方位麦克和3D传感器加持
半导体厂商一季度业绩向好，国产替代进程加速
据预测：2025年，全球卫星网络接入设备将达2亿台套
我国海上风电总装机容量仅次于英国，位居第二
里程碑式突破！揭示高能宇宙线起源之谜
青海省开启“集控站+无人值守”运维新模式提高设备运行水平
安徽首个量子计算芯片联合实验室成立打造具有全球影响力的“量子中心”
航天科工新一代通信技术研究院落户重庆聚焦“制造+研发”深度融合
我国活体组织成像技术干细胞研究应用领域达世界先领先水平
加快推进“双千兆”网络建设，聚焦网络质量提升
英国Arm推出新一代芯片架构Arm v9：性能提升将超过30%
2021世界智能驾驶挑战赛，将于5月21日至23日在天津东丽湖举办
ASO-S“探日”有望于2022年发射升空！探索太阳磁场
超高速互联网将普及计算助力缩小数字鸿沟
1至2月，我国规模以上互联网企业完成业务收入同比增长达29%
数字化转型找准“方向感”，打造国内商业数字化发展高地
加快5G网络规模化部署，打造数字经济新优势
探索5G行业融合应用 5G专网将进一步推动融合应用发展
中国移动香港5G商用一周年开拓5G商业场景应用
早期宇宙爆发“照亮”神秘黑洞或解释对于其他黑洞族演化的影响
7709米！哈工程“悟空”号创中国AUV潜深新纪录
人工智能领域新算法发布数据传输更高效精准
科技创新技术加持，我国船舶制造已达到世界前列
我国5G网络要坚持适度超前原则，探索5G应用发展
我国汽车自动变速器技术创新按下“快进键” 加速行业转型升级
AMR智能物流机器人，推动汽车行业智慧物流应用和发展
小米11 Pro/Ultra支持67W无线闪充如何实现更高效的充电?
我国可再生能源技术装备水平大幅提升，开发利用规模稳居世界第一
吉利帝豪S正式开启预售 8.67万元-11.07万元
科技助力智能生活垃圾分类投放点全新亮相
“越野之王”15592牛·米是飞度的100倍纯电悍马SUV正式发布
《仙剑奇侠传》1、2、3登陆Steam：512MB内存可玩售价没有公布
第一门户搜索网站雅虎旗下知名问答平台“雅虎问答”将于5月4日关闭
乐视贾跃亭回国有望？FF已提交上市文件
国内首个“5G+北斗”高速公路智能护栏预警系统上线
LG宣布退出智能手机业务绝唱旗舰V70现身运行Android 11系统
新一轮科技革命和产业变革持续演进，提高制造业生产效率
“能联全球”平台正式发布，推动全球能源电力发展合作
网曝拯救者电竞手机2 Pro真机谍照：采用RGB呼吸灯
雷军开启个人第三场直播：小米进军智能电动汽车行业
700MHz 5G网络共建共享落地实施！着重建设5G“黄金频段”
2021年底，5G网络基本实现县级以上区域、部分重点乡镇覆盖
腾讯视频VIP官方正式宣布进行涨价国内头部视频平台将逐步提价
苹果文档曝光：新一代Apple TV将发布配置大幅升级
智能机器人完成多项智能巡视任务，作业效率提高三倍
科技加持，长循环寿命的碳基锂离子电容器问世
在5G技术普及和共享市场日趋成熟下，共享充电宝集体涨价
苹果或将研发自动驾驶汽车平台，助力行业发展
人脸识别技术发展尚存三大隐忧，行业监管有待加强
郭守敬望远镜发布最新数据集 2022年光谱数量有望突破2000万
新技术助力机器人通过“透视墙壁”找到目标
在线办公平台用户规模增长迅猛新型“无纸化”工作方式成为热潮
科技加持，无人机阵列海水取样项目通过验收鉴定
数据转储作业整体时间缩短98% 建议运营商尽快出台指导标准
南京智能网联汽车先导区建设启动发布南京制造业2.0版新政策
一键接入贵州信息通信业全力推进适老化服务
信创产业正在迎来发展黄金期统信软件加快与主流芯片厂商合作
打破“只租不卖”的共享出行模式哈啰推自研智能两轮电动车
由于芯片短缺现代已经暂停IONIQ 5等电动车生产
滴滴货运将在北京等11座城市上线，具备录音桔视等安全功能
小米宣布将于明天举行小米影像品鉴会聊聊小米影像
腾讯控股日内成交额突破1300亿港元，港股下跌 0.79%
大众将为MEB平台加载V2G技术稳定可再生能源的波动供应
三星Galaxy Quantum 2首批谍照曝光黑色和白色
B站否认商谈收购游族网络 24% 股权及总部大楼游族网络直线拉升
消息称苹果因供应紧缺推迟MacBook和 iPad 生产苹果拒绝置评
小米电视及Redmi电视部分产品型号宣布涨价新机价格平均上涨 5-10%
微软宣布将于4月21日正式展示DirectX 12新功能与SDK
App Annie最新报告：全球用户在线视频应用使用时长近1万亿小时
小米 11 Ultra于4月8日海外开售，售价 5999 元起
联想拯救者电竞手机2 Pro正式预热拥有更出色的散热设计
苹果公司近日又遭集体诉讼 App 已构成非法赌博罪
LGD OLED官方电视面板已经获得 “防止炫光的显示产品”国际验证
微软Surface Laptop 4页面泄露将有英特尔和 AMD 两个版本
外星人推出M15 R5游戏本内含外星人高端外设
E Ink推出Spectra 3100电子纸扩大电子价签与零售广告牌应用
微信iOS版8.0.4正式版正式发布表情包上限提升到了 999 个
抖音内测 “发现”页大改，拥有播放器、音乐推荐等功能
蔚来汽车创始人李斌：目前每月7500台产能也存在压力
暴雪《暗黑破坏神 2 重制版》将开启限时技术测试持续到 4 月 12 日
魅族官方消息：魅族18的新用户中，45%来自苹果iPhone用户
消息称一加9R预计将在近期推出：一加国内的第二款中端机
realme GT Neo0点开启首销：顶配版2299元
小米11 Ultra明日海外开售：与国内6999元售价相近
realme真我GT Neo明日开售：搭载天玑 1200 处理器
2021中国（北京）国际游乐设施设备博览会在京开幕深圳市维亚环球科技有限公司受邀参加，并取得圆满成功
深入实施制造强国战略以四个方向加强制造业发展
有颌类动物的演化“谜团” 硕果仅存的有颌鱼类化石
数年攻克难题新科技“飞秒激光” 改变传统化学杀毒的新技术
我国神州十二号载人飞船成功发射中国人首次进入自己的空间站
我国研发人员总量连续多年居世界首位科技领军人才从哪里来？
如何打造一部更好的车？需要高性能计算平台支撑
重大科技电子枪顺利完成安装工程建设正式进入设备安装阶段
智能化极地科考船“雪龙2”号首次执行环南极考察任务
小米推出自动驾驶职位互联网造车话题再起