关于ChatGPT的个人八卦

专业吃瓜

看完了邱锡鹏教授的讲座, 难以按捺自己的吃瓜之情, 这里按讲座顺序八卦下.

免责声明: 笔者专业不是人工智能方向, 对这块所知了了, 本文仅为吃瓜八卦, 不保证内容正确性.

严肃讨论出门左转知网/arxiv.org/list/cs.AI谢谢

严肃讨论出门左转知网/arxiv.org/list/cs.AI谢谢

严肃讨论出门左转知网/arxiv.org/list/cs.AI谢谢

1. AI 学界对 ChatGPT 的能力/缘起有共识

目前为止我看过三个独立来源的学术分享.

北大高才生版论文综述: 符尧:拆解追溯 GPT-3.5 各项能力的起源
人话版论文综述: [张俊林：由 ChatGPT 反思大语言模型（LLM）的技术精要](https://mp.weixin.qq.com/s/MISCVMGeT6MvzzhfjHmyCg
还有就是今天看到的复旦大学邱锡鹏教授《大型语言模型的能力分析与应用》()

三个作者一个在爱丁堡读博(符尧), 一个在新浪微博 AI Lab 做负责人(张俊林), 一个在复旦大学尝试复现 ChatGPT(邱锡鹏, 人民邮电报:复旦大学团队发布国内首个类 ChatGPT 模型 MOSS), 但对 ChatGPT 的能力范围/缘起/训练过程的介绍思路几乎一模一样, 说明学术界内部对 ChatGPT 能力取得了共识, 否则声音不会这么一致

反过来, 这也说明学术界认可ChatGPT是大型语言模型, 而非通用智能模型这一论断, 基于这一论断可以得出的具体结论参考我上篇文章ChatGPT 快问快答, 简单来说就是, 凡是认为 ChatGPT 是通用型 AI或者基于 ChatGPT 可以在近期(5 年内)发展成通用型 AI,可以引发大规模失业/解决大部分问题的, 都是民科, 这些言论都可以略过了.

大型语言模型的作用只是根据上文生成合适的下文, 但不是正确的下文, 保证不了正确, 后续应用无从谈起.

太先进的科技在不了解原理的人看来宛如神迹

比如神话 ChatGPT 那一批

PS: 考虑到 ChatGPT 是半年前推出的产品, 6 个月时间世界范围内没有成功复现的案例, 说明 ChatGPT 技术实现上有门槛----那么后续对 ChatGPT 的功能改进也会更难一些. 目前看, 至少 3 年时间内不用担心 ChatGPT 对世界产生现实性影响.

2. 邱锡鹏教授做出来的不是国产 ChatGPT, 可能是 ChatGPT 的萌芽版 InstructGPT

参考邱教授自己在知乎上的点赞截图, 原答案在这里

点赞截图

InstructGPT 是 22 年 2 月提出来的, 目前看邱教授团队是世界第一个宣布复现出类 InstructGPT 模型的团队. 亮点是世界其他团队居然需要一年时间才能复刻 InstructGPT(InsructGPT 参数量为 0.13 亿, GPT-3 参数量 1.75 亿 , ChatGPT 则是 1750 亿. 可以近似认为大语言模型的能力和参数量线性相关), 说明 OpenAI 这条路确实不好走.

下一步应该是看百度预计三月份发布的文心一言和谷歌的Bard的效果, 如果效果和 ChatGPT 接近, 说明 OpenAI 的技术护城河没有那么深. 如果确认还是 ChatGPT 遥遥领先, 那后边追赶的路可就长了

邱教授介绍ChatGPT发展路径