LLM, GAN, 和未来恐慌 – 豆沙工作室

那么，图呢？

ChatGPT

我本来以为过了这么长时间，ChatGPT 的热度应该会下降回「学术界的又一个里程碑」的水平。但是资本的大力介入吹皱了一池春水。无论是微软还是 Google, 都在尝试将 ChatGPT 接入它们的搜索服务；黄伟达更是直言「ChatGPT 是未来」；而各种因 ChatGPT 而起的梗图也是层出不穷。

当然，这或许是因为 GPT-2 和 GPT-3 都不是开放使用而 ChatGPT 是开放使用的，所以它的热度才会这么高；或许是因为 ChatGPT 比起 GPT-3 而言已经有了更强的能力，其表现确实惊艳；或许是因为我们被这种近乎拥有智能的程序震惊到了，让我们止不住地想未来到底何去何从。毕竟，一个能保持对话进行的程序！它甚至可以解出很多威诺格拉德模式 (Winograd Schema) 句子，这在一些定义中已经可以算是「有类似于人类的智能」了。

ChatGPT 真的可以替代搜索引擎么？我的直觉说不行。当然事实证明也确实不行：Google 的 Bard 开局翻车，鬼扯无数错误的答案让 Alphabet 的市值蒸发了几个亿；微软的 New Bing 则和之前的尝试一样，稍有不慎就滑入犯病的深渊——你多问几个问题，它就会开始对你恶言相向。

或许我们在做一些完全不合理的事情——ChatGPT 是一个大型语言模型，其作用是生成类似于人类书写的文字序列。但我们在做的一切似乎都是在把它当成一种专家系统去追寻答案。尤其是「帮我写代码」、「帮我找资料」甚至是「帮我做决定」，我认为这些任务是完全超出 ChatGPT 的能力范围的：它无法保证生成的结果是正确或者符合事实的；它甚至压根就没有「正确」这种概念。更恐怖的是，它很会模仿人类进行写作，而它自信满满而又错误百出的内容甚至会让专业人士看走眼。

而我们现在却让这种玩意去写作业、写稿子、写材料、写论文……如果没有人工校验，那么其生成结果最终会是灾难性的：那些放任语言模型生成新闻稿的科技网站们，正在一篇一篇地修正文章里的错误。我们就像一个以为拿到了计算器就可以解决所有数学问题的孩子，在得到了那梦寐以求的高级计算器后在狂喜中幻灭。

DALL-E, Stable Diffusion, Midjourney, NovelAI...

其实在 ChatGPT 之前，给人冲击比较大的还是各种图片生成网络的兴起。

最早给人以震撼的是 DALL-E, OpenAI 研究的基于 GPT-3 的文字到图片生成网络。DALL-E 在那时就已经展示了「通过一段文字生成一张图片」这个任务对于计算机来说是完全可行的。DALL-E 是非确定性网络，意味着同一个输入可以生成不同的输出。不过由于 DALL-E 并非开放使用，所以和 GPT-3 一样，是学术界的又一个里程碑。

但是当 Stable Diffusion 出现时，一切改变了。

从此你可以通过文字告诉计算机你需要怎样的一幅图像，然后计算机居然就可以近乎于实时地为你生成一打图片供你选择。随着生成网络的迭代，现在生成的图像已经越来越精细，图片中出现的错误也越来越少。不少人认为生成网络取代画师只是时间问题。

不过伴随而来的便是令人头大的版权问题。许多图像生成网络的训练数据集包含未经授权使用的图片，而生成的结果也被一些无耻之徒反过来进行版权宣告。轰轰烈烈的「反 AI 运动」浪潮并没有能有效地解决 AI 产生的版权问题，反倒是把一些无辜的艺术家拍死在了互联网被告席。

和西乔的《代码的深渊》一样，AI 带来的麻烦只是引爆人类内战的导火索。大部分人的损失并不是由 AI 直接造成的，而是在人类阵营之间的矛盾和冲突导致的。

Humans Need Not Apply

2014 年 8 月 13 日，CGP Gray 上传了一部视频，标题为：Humans Need Not Apply.

这部视频已经 8 岁了。在那时，Gray 就已经认为自动化的浪潮将要来临，并且会取代大部分人类劳动力。即使是专家和艺术家也在所难免。不得不说这是一个非常有前瞻性的想法。在现在，「人工智能取代人类劳动」这个命题再次浮出了水面。

机器会先取代那些高度重复性的、重体力的劳动；接下来会逐渐接手那些无聊而浩瀚的文书工作，毕竟「机器不会疲劳，也不会犯错」；生成网络的成熟使得机器可以仿写人类的文字、声音和图像，加以合适的变化，便可以独立地生成原创的文字、音乐和图像制品；再接下来，它们将会「学会」科学方法，全自动运转的实验室会昼夜不停地逼近宇宙的真理……人类适合的工作会越来越少，先是大部分重体力劳动者失去工作，接着便是坐办公室的各位；艺术家们即使日以继夜地工作也难以比肩机器生成的近乎无穷的内容；就连科学家们也不能幸免，他们的实验室将不再需要他们亲自进入，他们的报告也由机器自动地生成。

「人类，你不再适合做这份工作。」

在内燃机车商业化之前，人们的主要出行方案仍然是马车。马车的大批量使用意味着马儿的大批量就业。但当内燃机车逐渐取代了马车之后，那些「下岗」的马的结果如何呢？新技术没有给马带来更多的就业岗位，为什么我们会认为新技术会给人带来更多的就业岗位呢？

未来滚滚而来，不问人们意见。

我们的最终目标是全体失业

自动化的浪潮会到来么？如果我采取一种「远视」的态度来看，那么我只恨自动化的浪潮没有把我拍死在沙滩上，我只恨机器没有大批量地取代现有的生产活动，我只恨他妈的我们没有从这个方案跑步进入共产主义。

搞自动化的人，都有一个终极目标，那就是通过不断地发展自动化技术把包括自己的所有人搞到失业。

但很遗憾的是资方对于 ChatGPT 的态度更像是一颗摇钱树。或许是因为对 AI 领域投入了这么多，到了资本退场的时候；或许是因为搞研究的人也是要吃饭的；又或许是因为我们的想法距离我们真正做出来的东西还是有个三五十年。

我最近开通了 GitHub Copilot. 它也是一个 AI 代码生成工具。在用了一段时间之后，我不觉得它可以取代我的地位，但是它确实可以帮我写一些重复性的代码。我们距离《代码的深渊》还有一定距离，尽管现在已经是 2023 年，一个故事中导火索已经被点燃的时间。

有些时候，我们会下意识地给机器安排一个「灵魂」，说它「听话」，说它「叛变」，把 AI 看作神明或者恶魔。但我总觉得它只是又一件工具，又一个改变我们对于世界的认知和操作方式的物件。我们害怕这种变化，于是抗拒这种变化。但或许我们会害怕所有变化，于是我们会抗拒所有变化。我想对于人而言，最可怕的并不是洪水猛兽，而是未知。

附录一威诺格拉德模式

威诺格拉德模式 (Winograd Schema) 是一种特殊的句子结构，用于改良图灵测试——一个用于测试人工智能是否有同等人类智能水平的测验。其围绕着「解析模糊代词」进行。如：

我给手机装手机壳是为了保护它。

问：句子中的「它」指代什么？

计算机应该可以准确地识别句子中可能被用于指代的部分，并给出正确的答案。更强的测试则要求可以改变句子中的一个词导致代词指代的对象发生变化，如：

市议会拒绝给示威者颁发许可，因为他们[担心/宣扬]暴力。

问：句子中的「他们」指代什么？

我不能把奖杯装进盒子里，因为它太[大/小]了。

问：句子中的「它」指代什么？

cssxsh说道：

2023-09-15 14:27

小王给局长送红来包。

局长：你这是什么意思。

自小王：没什么意思，意思意思。

局长：你这就不够意思了。

小王：小意思。

局长：你这人真有意思。

小王：其实也没有别的意思。

局长：那我就不好意思了。

回复

发表回复取消回复

Your comments will be submitted to a human moderator and will only be shown publicly after approval. The moderator reserves the full right to not approve any comment without reason. Please be civil.