首页 > 原创 > 正文

要闻：大语言模型中的涌现现象是不是伪科学？

来源：程序员客栈 2023-04-22 19:08:25

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

【资料图】

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

标签：

编辑：

要闻：大语言模型中的涌现现象是不是伪科学？

2023-04-22 19:08:25

Datawhale干货作者：平凡@知乎，诺桑比亚大学，在读博士今天晚上，花了一点儿时间看了两篇文章：《Emergent

选择大城市逐梦还是小城市安稳

2023-04-22 19:13:53

前不久有位读者提了个关于offer选择的问题，他的背景还是不错的，本科中流985，保研到了top2，研究方向是和

IPRdaily：大模型专利排行百度申请量第一资讯

2023-04-22 19:00:36

编程客栈（）4月22日消息:近日，IPRdaily中文网发布《中国人工智能大模型企业发明专利排行榜》，榜单显示:

最资讯丨第十三届北京国际电影节开幕红毯《新猪猪侠大电影·超级赛车》

2023-04-22 18:39:45

《新猪猪侠大电影·超级赛车》总制片人黄龙，导演钟彧，总发行曾艳，携手猪猪侠共同参与第十三届北京国际电

头条：意大利小伙罗密欧：与中国“有约”发现中国之美期待共创中国故事！

2023-04-22 18:47:58

“没有体验就没有发言权，我的责任之一就是加深对中国的认识，并用受众喜欢的方式来讲述在中国体验到的一切

环球新动态：得利斯董秘回复：公司不断加强市场终端建设，开设直营店、商超店中店、经销商加盟店等各类门店

2023-04-22 18:33:06

得利斯(002330)04月22日在投资者关系平台上答复了投资者关心的问题。

得利斯董秘回复：截至4月20日，公司股东人数为61,768人

2023-04-22 18:37:50

得利斯(002330)04月22日在投资者关系平台上答复了投资者关心的问题。

如何用汤骨头做饭-视焦点讯

2023-04-22 18:13:21

你需要的东西植物油（可选）米尔普瓦粗棉布过滤器或筛子小牛肉浓稠的胶状肉汤，炖菜的浓郁肉味和汤豆复杂的

笔记本电脑触摸屏失灵_笔记本电脑触摸屏没反应

2023-04-22 18:26:37

1、1 打开笔记本电脑，没有任何提示，但触摸板触摸完全没有反应。2、这时候要确保触摸屏不是锁上了，触摸屏

飞机的种类和名称大全_飞机的种类_当前关注

2023-04-22 18:17:50

1、按发动机类型来分，飞机有螺旋桨飞机和喷气式飞机之分。2、螺旋桨飞机是最原始的动力飞机，也是我们在老

中秋节的习俗作文_中秋习俗作文-时快讯

2023-04-22 18:07:19

1、中秋佳节，人们最主要的活动是赏月和吃月饼了。2、　　赏月　　在中秋节，我国自古就有赏月的习俗，《礼

河南省郑州市小莉帮忙咨询电话多少（请问郑州小莉帮忙的电话是多少知道的请告诉我谢谢）|全球滚动

2023-04-22 17:16:33

河南省郑州市小莉帮忙咨询电话多少，请问郑州小莉帮忙的电话是多少知道的请告诉我谢谢这个很多人还不知道,

极品飞车9pc秘籍（极品飞车9秘籍加钱）世界快看点

2023-04-22 17:12:57

极品飞车9pc秘籍，极品飞车9秘籍加钱这个很多人还不知道,现在让我们一起来看看吧！1、我这里有个9的作弊器

环球动态:新疆哈密：以“绣”为媒闯出一条刺绣致富路

2023-04-22 17:13:22

哈密传统工艺工作站发挥传统工艺覆盖面广、兼顾农工、适合居家生产优势,帮助绣娘实现居家致富梦想。　邢亚

当前讯息：B/R盘点需要换队发展的25岁以下球员：巴雷特托马斯入选

2023-04-22 16:50:58

北京时间4月22日，B R盘点了5名25岁以下需要换环境发展的球员。

热图推荐

得利斯董秘回复：截至4月20日，公司股东人数为61,768人

如何用汤骨头做饭-视焦点讯

笔记本电脑触摸屏失灵_笔记本电脑触摸屏没反应

飞机的种类和名称大全_飞机的种类_当前关注

创世纪

花样直播公屏聊天设置方法是什么？直播公屏上的主播信息怎么设置？

花样直播房间权限设置教程是什么？花椒直播如何修改认证信息？

花样直播检测语音教程是什么？花样直播麦克风怎么调节？

bilibili删除视频教程是什么？ b站删除的视频怎么找回？

电脑死机花屏的解决办法是什么？电脑屏幕花屏是什么原因？

搜狗浏览器字体大小设置教程是什么？搜狗输入法如何设置字体？

通信

最近更新

热点

2023年4月8日（上海）——黑马原力在上海徐汇滨江进行了品牌全球首发。品牌首款MPS产品G60小黑在发布会现场以自动驾驶的方式闪亮登场，点燃

CB-FH52是爱普生推出的3LCD商务投影机。作为新一代的商务投影机，CB-FH52具有高达4000流明的色彩亮度，投屏画面明亮清晰、色彩鲜艳，一经推

2023年2月16日，由流媒体网、易目唯文化主办，黑龙江龙网视传媒有限公司协办的第七届金屏奖暨2022年度中国智能视听与科技创新产业盛典在哈

2月14日,首届华彩杯算力基础设施应用创新大赛(以下简称大赛)在京正式启动。中国工程院邬贺铨院士、张宏科院士,工信部信息通信发展司一级巡

2023年1月13日，2022（第六届）中国行业数字化年度风云榜（以下简称2022风云榜）评选结果正式发布。本届风云榜由信息化观察网组织发起，以5

每年过年，必不可少的项目之一，就是发红包。一封封烫金封口、漂亮厚实的红包，带着一句句恭喜发财的欢乐祝福，浓浓的年味瞬间扑面而来。在