Logo Ernie.SG
声音先于符号:人类的创造力和智力不过是可计算的数据和现象的统计

声音先于符号:人类的创造力和智力不过是可计算的数据和现象的统计

June 18, 2023
1 min read
Table of Contents

A.I. “Stefanie Sun” Cover of Cung Đàn Vỡ Đôi by Chi Pu

一切的数据都烟消云散了

在《三体》的开头,向外太空发送信息为人类开启了一连串事件,其中包括失踪的科学家、社会冲突和政治阴谋,使得人类的生命和尊严在与外星物种的相遇中岌岌可危。人工智能的情节是否会有雷同,这个问题并不是新的,也许是因为我们看到了我们对待弱者和弱势群体的方式,并不完全美好。目前为止,我倾向于把意识和相应的自我意识与创造力和智力分开,也有点心存侥幸地希望这能为我们多争取点时间好更好地理解生命是如何从非生命中产生的。

由 Stable Diffusion 稳定扩散 WebUI 生成。

最近,我用 Vision Transformer 和 Stable Diffusion 生成了可使用任何语言歌唱的“孙燕姿”和风格迥异的图像,我很高兴我现在能比我有生之年更快、更好地“画画”,但同时也被一种不安和焦虑感所震撼,因为这一切都变成了一种人工的经验练习。这一系列的实验所引发的我最近宰相的一个问题是:当我们说:我们人类引以为傲的很多东西——我们的创造力以及我们的智慧——不过是可计算的数据和现象的统计,我们在说些什么?在这方面而言,我们不是机器的竞争对手。从某种意义上说,这是完全正确和释放人性的,但在其他维度上,有许多重要的细节都被丢失了,以这种角度去解读做而为人大部分工程是令人感到不安、可怕且焦虑的。

由 Stable Diffusion 稳定扩散 WebUI 生成。

使用 Stable Diffusion,我可以借用我的3070 GPU自由切换风格并在半分钟内生成4个不同版本的图片,即使我对绘画毫无兴趣,也丝毫没有兴趣学习,一些输出如图所示。显然,人工智能很奇怪,因为它只捕捉了我们现实的一个特定的侧面——我发现自己在负面提示中必须使用”large breasts” (“大胸”)和相关词语,否则模型会稳定输出比例夸张的女性身材。这整个现象的奇怪正如这个播客所谈,其中提出的这个强有力的问题也是我一直在思考的问题:

埃兹拉·克莱因:那么让我们用麦克卢汉的名言“媒介即信息”来解释一下,如果媒介就是信息,如果媒介编码了某些存在和思考的方式,从而改变了使用它的人,你认为人工智能聊天机器人媒介的信息是什么?值得注意的是,这是一种建立在技术之上的媒介。聊天机器人只是众多应用程序中的一种。事实上,这作为其中一个正在一个起飞的应用也将塑造技术不同于它其他的可能。但是,这种媒介传递的信息是什么?

由 Stable Diffusion 稳定扩散 WebUI 生成。

这对我们个人来说意味着什么?当建模和建造预测机器用于人类的创造力和智力是如此之好用时,我们应该如何应对?我的初步反应是,神秘感的丧失和奇迹的获得如同硬币的两面:当我们将人类的智慧和创造力最小化,可能的积极结果也许是我们被迫重新审视做而为人的意义和我们对彼此的义务——与每个人的智力和/或创造力水平如何无关;但从更险恶的角度来说,我确实担心,如果我们不深思熟虑地对待人工智能,它会在全球社会中造成比贸易和社交媒体叠加起来的影响更深刻的裂痕。

换一种方式来说,也许大多数人的智力和创意都比不过人工智能。这里面也算我一个。可是这也侧面反映了人类的价值不应该和智力和/或创意挂钩,而是我们做而为人,本就应当对彼此有一定的责任和义务。

数据集偏差和有效的提示

我正在尝试的运用场景是使用人工智能完成自动内容生成——让人工智能以各种格式和语言生成所需内容主题的视频脚本和图像,并自动发布到多个平台上。不幸的是,这篇文章仍是手工制作。在这样实验的过程中,有趣的是得以亲眼看到了人工智能的偏见——系统默认产生的每个女性形象都是身材比例相当夸张的,直到我指定它别返回大胸。这让我联想到了其用于训练的数据集,以及我们在媒体上看到的有多少是经过精修修饰的现实,那么实际上到底是谁应该受到责备呢?

在尝试了多种我可以从网上自由下载的模型后,我决定采用一种漫画风格。不出所料,有很多模特专门用于色情内容制作。再加上通过文本反转定制和训练自己的 Stable Diffusion 模型是多么容易…事实上是,任何拥有普通游戏PC的人都可以生成假以乱真的色情内容。

我希望政府、学校和家长都能针对人工智能展开有效的谈话与应对,我能抱有这样的希望吗?

为什么人工智能是特殊的

先把这些负面的影响搁在一边,我对人工智能很感兴趣,因为从1956年达特茅斯会议上的诞生时刻开始,从第一个单层神经网络感知器到现代深度学习,人工智能在很短的时间内取得了很大的进步;我们只需要在当下看看我们周围,看看人工智能已经能做些什么,已经可以用现有证据为基础做出前瞻性预测。许多其他流于口号的所谓技术都是衍生于潜在的愿景的一些可能的未来,试图在当下找到牵引力(并惨遭失败),但在这方面人工智能是有别于其他这些口号的。这就是为什么我看到了它与蒸汽机的雷同,同样地也可能是为什么有些人甚至把它比作火或电的原因。

“我一直认为人工智能是人类正在研究的最深奥的技术——比火、电或我们过去所做的任何事情都要深奥。”——桑达尔·皮采,谷歌首席执行官

史密森尼博物馆展出的马克一号感知机。(来自:https://ronkowitz.blogspot.com/2017/11/perceptron.html)

1958年,单层感知器涉及到实际的电线和一个巨大的机器;而当我在2022年在我家客厅的普通游戏PC上面运行卷积神经网络模型以进行多标签分类,像ResNet-512这样的模型有512层深。

人工智能是一个经历了许多个冬天的故事,但它从来没有降温人们对赋予机器思考能力的兴趣。人工智能冬天的漫漫长夜、它的统计转折、融合数据和GPU使旧模型的寒武纪大爆发成为可能,以及神经网络的终极报复,这些都是我希望接下来讨论的东西!


Originally published on PubPub at erniesg.pubpub.org/pub/9hq39jmi.