京ICP备2023000331号-26 投诉举报:315 541 185@qq.com
■图像时代的法律
吴志攀作品
【资料图】
这只是现实世界图像中的被文字标注的一部分,还有更大部分的图像不能被计算机生成。如果将来我们满足于这一部分概念化的、文字标注的图像,那我们将成为新的“井底之蛙”
“提示词”为王的AI生成图像
有人说,AI(人工智能)生成图像将“取代”一些行业的工作。这种说法不论是否成立,现在已经在网上炒得人心惶惶。但是经过一段时间的观察,我反而认为它并没有说的那么可怕。说归说,做归做。过去,有人预言过在信息化之后,将进入“无纸化”办公时代。但信息化都这么多年了,现在办公用纸比过去只多不少。类似的例子,历史上还出现过若干次。
例如,照相机问世之初,就有人预言画家们要失业了。因为请画家来画一张肖像,通常要耗费半天或更长的时间,但照相机几秒钟就完成了。人们当时看风景写生画,也是同样的感觉。照相机对着风景一拍,照片很快就能装到镜框里,并挂在墙上了。但是,照相机已经存在一百多年了,画家非但没有失业,后来美术学院招生规模比我高考那年(1977年)人数还扩大了几倍。
如果说人数还不能说明问题,那不妨看看这个——在照相机问世后,美术史上出现了一场天翻地覆的变革:抽象画诞生了。此后,越来越多的当代美术流派随之而来。后者所呈现的画面,是照相机拍不出来的,因为它们在现实世界中根本不存在。
更让一些人意料之外的是,在高像素的彩色照相技术普及之后,类似冷军先生这样的超写实绘画法,依然成为美术馆中的亮点——观看人数和时间都超过其他作品。人们对这种画法的讨论之多,也超过其他画法。虽然美术评论界对这种画法褒贬不一,但在商业界有句老话:“褒贬是买家”。这足以说明:超写实画法的生命力非但没有被高像素彩照压抑,反而总是在与其媲美。
现在的AI生成图像技术问世了。图像是计算机从数据库中海量图像筛选组合而成的,图像数据库中每一张图像又都是由数据库标注师用文字标出来的。这样,使用者输入提示词,计算机就能够根据“提示词”到数据库中搜索相关图像来生成。使用者得到的图像生成结果不满意,就重新调整提示词再次输入,直到计算机生成满意的图像为止。
这样看来,图像生成的时间比绘画短得多,比摄影也方便得多,但问题在于,我们的眼界、想象力和创造力被“提示词”给束缚住了。因为计算机不会超出数据库范围和“提示词”引导之外来生成图像。而人类的绘画不是建立在“提示词”基础上的,更不受语言文字的约束。音乐创作也是如此,“无标题音乐”就是一个例子。但是计算机却不能不受语言文字的限制,即图像生成机制是“概念化”的。这就注定了图像生成技术无法替代人,电脑无法替代人脑。计算机图像生成技术只能做辅助工作,创造动机和想象力依然离不开人。
人类的创作动机和想象力超越“提示词”
语言文字是人类对现实事物的抽象概括,如人类将世界各地生长的不同品种的苹果概括为抽象的“苹果”。将千万条大小长短不同的河流,概括为“江河”。抽象概念表达可以将人类思维得以运用语言文字表达出来,通过表达出来的分析和归纳得出结论,并实现人与人之间的交流。
语言文字的功劳非常大,无论怎样强调都不过分。但是,语言文字所能表达的概念是抽象的,不是具体的;是概括的,不是个性化的。例如,我过去听长辈说过一个故事:老父亲请学哲学的儿子吃鸡,儿子说却说:“‘鸡’是抽象的,不能吃。我只能吃‘具体的鸡’。”这种说法把老父亲给说糊涂了。老父亲问儿子:“你今天给我个痛快话:到底是吃鸡还是不吃鸡?”我国古代也有“白马非马”的例子,即“白马”是具体的马,“马”是抽象的马。这与上述故事表达的都是同一个意思。
人类绘画,可以是概念化的,也可以是具体化的。前者多见于图案画或装饰画,后者多见于写生。特别是人物写生,老师总是强调不要概念化,要具体化。例如,达·芬奇笔下的《蒙娜丽莎的微笑》,就不能概括为“微笑”。如果是那样,就称为无差别的微笑了。“蒙娜丽莎的微笑”,才是这幅名画的看点——这个微笑只能在蒙娜丽莎的脸上才能看到,与在其他人脸上看到的“微笑”不一样。
如果看着这张画上的笑容,再看“蒙娜丽莎的微笑”文字,观众就会发现,文字尽管已经具体化了,但是比起画面所看到微笑的丰富性,还是太单调了。因为每位观众看这幅画上的微笑感受都是不一样的。因此,如果要用文字把每位观众从这张画面上看到的微笑具体描写下来,那要写成几本书了。所以,文字概念不能代替图像,各有各的特点。文字的优势在于抽象和概括,图像的优势在于具体和直观。
正是因为这一差异,在现实世界中文字与图像各自承担了不同的角色。我们的世界才如此丰富多彩。现在的计算机提示词是文字的,对应的数据库中的图像是提前用文字标注过的。在这种情况下,用计算机图像生成技术呈现出来的图像,也就会是“概念化”的。这只是现实世界图像中的被文字标注的一部分,还有更大部分的图像不能被计算机生成。如果将来我们满足于这一部分概念化的、文字标注的图像,那我们将成为新的“井底之蛙”。
人类图像创作过程的意义
AI生成图像的结果可能与人类绘制或摄制的图像已经难以分别,但是,人类创作图像的过程体验难以被计算机替代。如同今天手机已经可以将人的语音转变为文字,人们对着手机说话,手机屏幕上即显示文字出来。这样人们可以不用手写或键盘输入文字,就可以“说”出文字来。
但是今天,我国另一种学习书法的热潮正在兴起:许多书法爱好者乐于使用毛笔,亲手研墨,在宣纸上临帖或创作。上千年的古代书法家们的碑帖又在网上热卖,王羲之的《兰亭序》、颜真卿的《祭侄文稿》、苏东坡的《寒食诗帖》等名家字帖成为书法临习者的范本。由于书法热,网上字帖、毛笔和墨汁的价格已经上涨,宣纸更是“洛阳纸贵”。
如何解释这种文字“返祖”现象呢?大家都知道用硬笔书写比毛笔更方便,用键盘打字比毛笔书写速度更快,用口授录音转成文字比打字更省事,但是为何还这么多的人不要方便,放弃速度,不怕费事,而选择耗时费力地写毛笔字呢?这背后,是书写“过程”给人带来的安静,放松和愉悦。如同练习冥想、打坐、站桩一样,书法也能给人减轻压力,带来降低抑郁水平等效果。过去,人们说腹有诗书气自华。同样,练习瑜伽或书法的人,言行举止也给人带来一种安静和稳重的气质。各种科技带来的便利和省时和高效书写工具并没有替代从古至今流传不断的书法技艺,反而引起越来越多的人对这种古代技艺产生敬佩、向往。
人类制作图像如同写文章,都是一种将思维过程表现出来的过程。图像制作是“图像思维”的呈现,如构图、留白、造型、疏密、浓淡、内收或外扩等对比关系。写文章是逻辑思维的呈现,遣词造句、布局谋篇、起承转合,或豹头、猪肚、凤尾排布等。无论使用计算机,还是手工操作,人的这些思维都是必不可少的。计算机还没有自主意识,因为还离不开人的自主思考,计算机只是在人的思维呈现时提供帮助。
AI生成图像也是如此。但是现在主要依靠“提示词”来在数据库中搜索和组合,而数据库中的图像又被贴上标签,以便让输入的“提示词”形成搜索到。这便形成两个文字“概念”的自动“撮合”。这个解决方案在省时省力方面的效果是有的,但局限性也是很明显的。
“提示词”成为图像生成的先导可能引起“物极必反”的结果,就像抽象绘画以及后来的当代艺术各种流派绘画挑战照相机一样,让照相机无法拍出现实中不存在的景物。AI生成图像由于受到“提示词”文字限制,也同样会因为缺乏想象力和创造力,因为缺乏新鲜感而被人们“熟视无睹”或“视而不见”。而人类继续绘制出计算机AI无法生成的图像:因为这些图像无法用语言文字标注,或难以用现有的文字概念来做归纳,或已经超出人类现有语言文字的认知范围。
这些超文字和超概念的图像,也可以说是“超标注图像”,或“无提示词图像”更考验人脑的创造力和想象力,所以当人们看到这种图像之后,比较数据库中海量标注后的图像,反而会对无法标注的图像更加珍惜。道理很简单——物以稀为贵。
(作者系北京大学法学院教授)