作者简介|PROFILE
程羽黑,上海交通大学人文艺术科研院专职科研员。
摘要:现周期的AI诗歌是“无意图”的诗歌,AI诗歌算法的完善能避免无效诗句的显现。开发者不必追求强人工智能作诗,而应在现有的弱人工智能框架下,经过文体和风格的专门训练提高AI诗歌的水准。经过比较诗歌的人文性和科学性可知:两者并不是互斥的,而是相容的,最后殊途同归。人类不必担忧AI诗歌的将来,亦不该把重点放在AI诗歌的拟真性上,而应扬长避短,经过AI的量化优良探索诗歌的可能性。
关键词:AI;诗歌;意图;风格;算法
全 文
2022年,OpenAI发布了对话语言模型ChatGPT,诱发了AIGC(人工智能生成内容)的热潮。人工智能生成诗歌亦是AIGC的重要主题。2019年,笔者发布《人工智能诗歌论》,探讨AI诗歌创作的前景和局限。此后,BERT和GPT两种基于Transformer算法的预训练语言模型为NLP(自然语言处理)带来了革命性的突破,亦给AI文艺开启了广阔的提升空间。新技术印证了拙文的部分结论,亦引出了新的问题。
学界对AI诗歌已有许多关注,初期的论述大多来自国外,既有对AI诗歌本质的探讨,亦有作诗机的设计,限于技术,这些讨论虽不乏真知灼见,但仍处在较为原始的周期。进入21世纪后,国内学者发布了不少关于AI中文诗歌的技术讨论,其成果多被诗歌算法所吸纳。2017年随着微软小冰的诗集《阳光失了玻璃窗》出版,人工智能诗歌受到国内人文学界的关注,热度大增,科研成果颇多。如霍俊明的《“克隆体李白”与百万亿首诗——AI诗歌的“类文本”生产与可能前景》用马克思、海德格尔、鲍德里亚等思想家的观点对AI诗歌进行了思考,认为AI诗歌已然“是人类文学发展链条的一个构成部分”。李睿的《基于语料的新诗技:设备诗歌美学探源》介绍了最早进行设备诗歌创作的德国斯图加特诗派和为设备诗歌审美奠定基本的本泽信息美学理论,为AI诗歌创作理清了源头。陶锋的《人工智能文学的三重挑战》则得出结论,“人工智能难以生成拥有‘审美规律’的语言”,“不拥有艺术的核心要素”。笔者将在下文论证,随着技术的发展,AI诗歌的拟真度越来越高,这些问题都有可能在技术框架内得到处理。
纵观当前的科研,无论是关于AI诗歌的文学理论还是技术路径,都已取得了相当丰富的成果,但两者尚缺乏有机的结合。人文学界虽关注AI诗歌,但对详细技术发展和诗歌创作细节的认识有限,只是从哲学和文学理论的方向讨论,得出的结论常常失之浮泛,缺乏应用性;AI诗歌技术科研者则对文学关注不足,在设计算法时忽略了诗歌技巧,影响了AI作品的质量,引起其缺乏审美性。其实,对AI诗歌的文学讨论必要联系技术发展的脉络,开发AI作诗算法亦必要创立在对诗歌深入认识的基本上,两者应形成文学辅助技术、技术支撑文学的正反馈循环,为AI创作的发展供给助力。笔者拟据AI的状况和诗歌的技艺,从一个独特的方向看待AI诗歌,并提出详细而微的意见。
1、“无意图”的诗歌
现周期的AI写诗,是经过语言模型学习人类诗歌,将自然语言转换为向量(vectors),按照概率统计模仿资料库中的文本。它的行径来自人类的指令,并不存留意图(intention)。关于诗歌的意图,重点有两种观点:
第1种观点认为,诗歌必要有意图。《毛诗序》:“诗者,志之所之亦。”这是将“诗”定义为意图(“志”)的产物。意图是可解的,如《孟子·万章上》所说:“故说诗者,不以文害辞,不以辞害志;以意逆志,是为得之。”读者能够经过自己的心思揣度文辞背面的意图。当然,可解并不寓意着有一个知道的定解;事实上,“歧义”(ambiguity)是诗歌这一文体的重要特征。威廉·燕卜荪在《朦胧的七种类型》中说:“诗人将两个描述放在一块,似乎二者是相互联系的,而读者则被迫去思虑它们的联系,还得自己去设想诗文为何选取了这些事实。他会设想出各样原由,并在脑中将它们摆列起来。这是诗歌语言在运用方面的基本事实。”读者并不可肯定自己的诠释是正确的,但他相信作者必定在描述之间埋下了关系。套用杜牧的名言,“丸之走盘,横斜圆直,计于临时,不可尽知。其必可知者,是知丸之不可出于盘亦”。作者的意图是什么,“不可尽知”,但作者有意图却是“必可知”的事实。倘若作者无意图,那就如同丸出于盘,打破了阅读的规则,所有诠释的企图都会落空。这般的诗歌本质上是不可解的,哪怕它在字面上可解。
第二种观点认为,诗歌不必须意图。新批评派的威廉·维姆萨特指出,诗人的意图和诗歌是两回事,就像面包师的意图和面包是两回事,他把“将诗与其产生的过程混淆”的观点叫作为“意图谬见”(intentional fallacy)。罗兰·巴特主张“作者之死”(La mort de l’auteur),“读者的诞生必要以作者的死亡为代价”,“作者一旦除去,解释文本的主张就变得毫无益处。给文本一个作者,是对文本横加限制,是给文本以最后的所指,是封闭了写作”。认识作者的意图既无必要,亦不可能,由于作品在完成后,已与作者切断了联系。诠释应该始于文本,止于文本。
诗歌史上不乏“无意图”的实践。中国古典诗歌有“联句”一体,由两个以上的作者,每人创作若干诗句,轮流赋诗,任何一位参与者都没法决定诗的走向。日本有“连歌”,英译作“chain poem”(连锁诗歌),由多人一起创作,原理与中国的“联句”类似。这类诗歌经过增多主体,实现复数话语,在形式上消解了单一的意图。
20世纪初兴起的超现实主义(Surréalisme)有认识地追求“无意图”的诗歌。巴黎的超现实主义者设计过一个名为“精致的尸体”(Exquisite Corps)的游戏。参与者在互不知晓的状况下,依据词性随意写下词语,最后组合成句。她们经过这个办法得到的第1个句子是“精致的尸体会喝下新的葡萄酒”(Le cadavre exquis boira le vin nouveau)。这句“诗”诡异中透着优雅,Le cadavre在法语白话中又有“喝空的酒瓶”之义,一语双关,富有情趣。
那样,“无意图”诗歌有什么道理呢?诗人常常会在创作中形成路径依赖,“无意图”恰恰能够打破这种惯性。艺术中的“即兴”(improvisation)亦是经过不假思索达到接近“无意图”的效果。当然,“无意图”的诗歌必要是能够理解的句子,而不是一堆不知所云的文字。诺姆·乔姆斯基杜撰过一句“无色的绿色想法在狂热地睡觉”(The colorless green ideas sleep furiously) ,说这般的句子虽然“符合语法”(grammatical) ,却不是“有道理”(meaningful)或“有寓意”(significant)的。“精致的尸体”游戏虽然偶有灵光,大部分结果却是无道理、无寓意的无效语句。这就必须人类凭借微妙的感觉和经验,从中沙汰出佳句。
初期的作诗机原理与“精致的尸体”无异,按照词性、格律或韵脚随机填充词汇。这种伪人工智能(pseudo AI)产生的无效语句数量实在太大,就像大自然中随机生成的奇木异石,仅有极小一部分能被人类当成宝贝。即便是采用循环神经网络(recurrent neural networks)而具备了初步智能的AI诗人微软小冰,亦必须人类从它创作的一万首诗中选择139首。随着NLP的发展,新AI的无效语句大幅减少。如人工智能程序Deep-speare,在深度学习了2700首十四行诗(sonnets)后起始创作,科研者将它写出的诗与人类的诗混合,让志愿者识别,正确率仅有一半,说明Deep-speare创作的诗在必定程度上已能以假乱真;由兰州大学计算机专业的王子尧研发的作诗算法“击壤”,运用GPT2模型和BART模型,生成符合格律的近体诗,作品经过了六百多人的图灵测试。算法的完善终将产生“零无效句”的“电子诗人”。
通常认为,仅有具备自我认识的强人工智能(strong AI)才可写出真正的诗,由于真诗是表达欲望的产物,而当前的AI是无意欲的。但强人工智能和人类是完全区别的智慧体,它乃至很可能无个体认识——就当下的AI而言,其存在形式是整体而非群体,按照冯·诺依曼结构(von Neumann architecture),存储器将参数分配给芯片进行运算,而后将结果返还到存储器。区别的AI之间算法原理区别,相当于区别生物,难以形成对等主体之间推测意图的“主体间性”(intersubjectivity)。在无个体认识的状况下,强AI自发产生的文本是无“隐含读者”(implied reader)的,自造而自观,与人类的诗歌迥异其趣——当然,这类文本表达形式亦应是非人类的。倘若它写出人类的诗歌,那样依然是在模仿,况且是持有认识的智慧体对人类的模仿,让人想起童话中模仿小红帽外婆声音的狼。因此,期望强人工智能作诗是无必要的,在当前工具性的弱人工智能(weak AI)框架下,AI完全可能产出人类必须的诗歌,因此咱们应该关注怎样处理诗歌质量的技术问题,而不必在“AI写的是不是诗”这一基本性专题上纠缠。
总之,诗歌本质上是人类的概念,AI的诗歌开发应以满足人类的需求为原则。
2、AI诗歌的文体和风格
AI诗歌在文体上已有分工,以中文诗为例,旧诗、新诗都有专门的AI,在模仿上各有难易。新诗更加多地追求语言的陌生化、断片化,乃至“去人性化”(enthumanisierung),与基于平常经验的自然语言截然异趣,这是新诗比旧诗容易模仿之处;旧诗在格式上通常更加整齐,字法、句法、章法皆有招数可循,这是旧诗比新诗容易模仿之处。
相对来说,旧诗的法度较为森严,更适合AI循序渐进地学习。旧诗中,近体格律诗词比古体诗易仿。由于通常来讲,古体诗篇幅较长,亦较多显现接近自然语言的散文式句法,与人类的平常经验关系紧密。如韩愈《山石》:
山石荦确行径微,傍晚到寺蝙蝠飞。
升堂坐阶新雨足,芭蕉叶大栀子肥。
僧言古壁佛画好,以火来照所见稀。
铺床拂席置羹饭,疏粝也足饱我饥。
夜深静卧百虫绝,清月出岭光入扉。
天明独去无道路,出入高下穷烟霏。
山红涧碧纷烂漫,时见松枥皆十围。
当流赤足踏涧石,水声激激风吹衣。
人生如此自可乐,岂必局束为人鞿。
嗟哉吾党二三子,安得至老不更归。
此诗无一比喻,属于“直陈式诗歌”(poetry of statement),完全是对生活经验的直观记叙,而这正是无生活经验可言的AI所无能为力的。或许要等到“具身认知”(embodied cognition)技术的实现,AI经过模仿人类感官的仿生传感器(biomimetic sensors)和模仿人类神经元网络的人工神经网络(artificial neural network)再现人类的刺激—反应(stimulus-response)模式,获取平常经验,才可把握表述此类文字的能力。
对当下的AI较适合的中文诗体是律诗和绝句。这是由于:一,这两种诗体较短,容易维持顺畅的语流(speech flow);二,这两种诗体通常受到格律限制,句子间无需像自然语言同样连贯。如杜甫《登高》:
风急天高猿啸哀,渚清沙白鸟飞回。
无边落木萧萧下,不尽长江滚滚来。
万里悲秋常作客,百年多病独登台。
艰难苦恨繁霜鬓,潦倒新停浊酒杯。
此诗四联皆为对偶(首联入韵,是对偶而非对仗),每一联的上下两句并无递进关系,而呈现对立结构,亦便是说,下句是与上句齐头的另一个句子,而非直承上句的“第二句”,AI无需思虑其间的接榫。当然,这亦不是绝对的,绝句中有“松下问童子,言师采药去,知这里山中,云深不知处”这般通体如一句的连贯之作,律诗中亦有“即从巴峡穿巫峡,便下襄阳向洛阳”这般上下贯穿的“流水对”。连贯本身不是问题,问题在于AI缺乏与连贯对应的心理规律。现周期AI语言的困境不在语句——正确表述人类语言的语句对AI来讲已能胜任愉快——而在于维持符合心理规律的语流。AI固然能够经过文本学习心理规律,如NLP人工智能采用关系抽取(relation extraction)形成知识图谱(knowledge graph),但仅限于较短的句群(sentence group),对篇章的模拟很不睬想,因此AI创作的比较成功的文字局限于资讯报告、公文等篇幅短小、规律简单的格套文案。律诗和绝句这类较短的格律诗体,能够避免这一短板。
那样,词的状况怎样?词是古典诗歌中一种特殊的格律体,通常来讲在格式上不如诗规整。词的风格差别很大,有通首连贯的词,如陈与义《临江仙·夜登小阁忆洛中旧游》:
忆昔午桥桥上饮,坐中大都是豪英。长沟流月去无声。杏花疏影里,吹笛到天明。
二十余年如一梦,此身虽在堪惊。闲登小阁看新晴。古今多少事,渔唱起三更。
唐圭璋评估这首词“一气贯注”,语流绵长而顺畅,AI模仿的难度不小。亦有语段零碎的词,如吴文英《齐天乐·与冯深居登禹陵》:
三千年事残鸦外,无言倦凭秋树。逝水移川,高陵变谷,那识当时神禹?幽云怪雨,翠萍湿空梁,夜深飞去。雁起青天,数行书似旧藏处。
寂寥西窗久坐,故人悭会遇,同剪灯语。积藓残碑,零圭断璧,重拂人间尘土。霜红罢舞,漫山色青青,雾朝烟暮。岸锁春船,画旗喧赛鼓。
张炎评估:“吴梦窗词,如七宝楼台,眩人眼目,碎拆下来,不成片段。”这首词的描写方式不是线性的,其中用到闪回等手法,看似较易被AI模仿,但词中实有贯穿全局的“意脉”,形散而神不散,且典故繁多,模仿起来并不易。
AI的律诗和绝句模仿,在拟真度上已然达到了必定水平。旧体诗算法如清华的“九歌”、华为的“乐府”、GitHub上开源的“诗三百”,作品常令人真假莫辨,尤其是篇幅最短的绝句,偶有惊艳之作。但篇幅扩展到律诗,有古典诗词修养的读者会发掘其诗意不贯。笔者在写下这段文字时(2023年3月5日12:44),随手在“诗三百”上以“游太湖”为题生成为了一首七律:
太华三峰高插汉,天风吹下步虚声。
云开万顷琉璃色,月照千寻翡翠城。
玉女擎将秋露冷,仙人采得夜珠明。
何当跨鹤凌空去,笑指蓬莱第1程。
单看句子,相当成熟,颔联尤其瑰丽,但整体来看,东拉西扯,如“太华三峰”远在华山,与太湖毫无关系,因有个“太”字,被AI当成为了“太湖”的相关词放进诗里。“天风吹下步虚声”实为唐代诗人许瀍的成句,可见是从诗歌资料库中直接挪用的。不外,这些亦是人类初学者常犯的毛病。咱们很难将AI的作品和初学者的习作区掰开来。笔者有一位教师伴侣是诗词好手,在某大学为本科生开设诗词创作课,常为不可分辨收上来的作业是人作还是AI作而苦恼,他说倘若将AI写的诗放在能手的作品里,倒是一眼可辨,这亦寓意着作诗机仍有很大的改进空间,当下研发者的任务是把AI从初学者调教成成熟的诗人。
提高水准的关键在于风格的分析和学习,这恰恰是AI的强项。风格在文学史上是鉴赏派批评家关注的重点,常常基于个人的阅读印象,并无知道的指标,因此常有争论。AI却能将风格之间的区别予以量化。兰州大学计算机专业的王子尧将约120万首诗歌作品存入csv文件中,每篇作品对应文件中一行,分为“题目”“朝代”“作者”“内容”“关键字”“主题词”六个字段进行储存,用BART-poem模型判定诗歌风格,结果是个0到1之间的实数,显示属于某一风格类型的概率。王氏把风格分为唐、宋两种,取得了精确而丰硕的成果,不仅用数据验证了明七子学唐、同光体学宋等文学史上公认的评估,亦证实了钱锺书“王渔洋晚年诗染宋调”等未经论证的结论。可惜的是,AI从海量参数中到底学到了什么规则、详细怎样得出这些数字,仍处在“黑箱”(black box)中,不为人类所知。但AI经过大数据和高速运算得出的结论在精细度上远强过人类凭借印象的论断,这是不争的事实。
鉴于AI对风格辨析的优良,开发者能够创立专门的诗歌归类资料库对AI进行训练。王子尧利用“击壤”算法进行了同光体诗的专项训练,效果明显,如以同光体诗人陈三立的五律《夜舟泊吴城》的首句“夜气冥冥白”生成的五首五律:
夜气冥冥白,灯光的的红。旅愁缘酒破,归梦为诗穷。路断人行少,川寒鹭语空。苦吟兼怨泣,剖血答天公。
夜气冥冥白,寒云冉冉轻。老怀犹薄醉,暗月已深更。违俗书常卷,怀人梦不成。萧条吟瘦影,起帐觉秋生。
夜气冥冥白,斜阳黯黯红。城衔山落照,树出水生风。芳草王孙外,孤舟客思中。行吟不可寐,烧烛旋书空。
夜气冥冥白,寒云黯黯垂。那知竹窗下,独听雨声悲。灯火淡欲死,肺肝空自知。泪珠抛不得,付与梦中期。
夜气冥冥白,江波袅袅寒。鱼龙移树听,灯火隔船看。故旧几人在,凄凉百感攒。寸心如蜡烛,泪尽不可阑。
(陈三立原作:夜气冥冥白,烟丝窈窈青。孤蓬寒上月,微浪稳移星。灯火喧渔港,沧桑换独醒。犹怀中兴略,听角望湖亭。)
笔者将五首AI作品发布于微X伴侣圈,留言者都认为其中最少有部分是人写的。这五首诗在字句上已与中等水平的诗作几乎无异,瑕疵很少(第1首“剖血答天公”、第三首“树出水生风”不通),有些句子,如“旅愁缘酒破,归梦为诗穷”“灯火淡欲死,肺肝空自知”“鱼龙移树听,灯火隔船看”,对仗工稳、句法老辣,置于古人诗集中亦可当佳句而无愧。同光体以筋骨见长,总体质量相当高,AI以此训练,自然远强过以往不加选取的资料库。当然,审视这些作品,会发掘相比于字句上的进步,AI在生活经验上仍会犯低级错误,露出破绽。如“夜气冥冥白”明明已经是入夜,后面却接以“斜阳黯黯红”“城衔山落照”的傍晚之景;“苦吟兼怨泣”“烧烛旋书空”的动作组合亦有悖于人情。这恰可印证上文所说AI缺乏平常经验的短板。
AI写诗此刻相当于人类的初学者。对初学者而言,正确的途径非常重要。严羽的《沧浪诗话》开宗明义:“夫学诗者以识为主,入门须正,立志须高。”此刻AI训练的资料库包罗太广,开发者忽略了其中的潜在矛盾,导致其诗歌常有风格抵牾的现象。诗人于坚评估微软小冰:“(小冰的诗作)冷酷、无心,修辞的空转,东一句西一句随意组合,意象缺乏内在规律,软语浮词,令人生厌的油腔滑调,原材料来自平庸之句。这个软件对诗的理解是电视台诗歌朗诵会的水平,这个软件设计不出灵性,设计不了‘诗成泣鬼神’。”其实这与其说是AI的问题,不如说是研发者的问题,“软语浮词,令人生厌的油腔滑调,原材料来自平庸之句”显然源于人类在供给材料时未予甄别。“诗三百”对诗歌进行了时代归类,分成唐、宋、元、明、近代、现代六种风格,但诚如钱锺书所说:
唐诗、宋诗,也非仅朝代之别,乃体格性分之殊,天下有两种人,斯分两种诗。唐诗多以丰神情韵善于,宋诗多以筋骨思理见胜……曰唐曰宋,特举大概而言,为叫作谓之便。非曰唐诗必出唐人,宋诗必出宋人亦。故唐之少陵、昌黎、香山、东野,实唐人之开宋调者;宋之柯山、白石、九僧、四灵,则宋人之有唐音者。
时代的“唐宋”与文学风格的“唐宋”并非一事,因此不可仅按时代划分。材料必要由精通诗歌的开发者甄选,对AI则应按照区别的需求进行专项训练,上文所举同光体训练模型便是一个成功的尝试。笔者认为,《二十四诗品》将古典诗歌风格分为二十四种,亦是一个很好的参照,能够据此选诗创立资料库。这一过程中,AI对风格的量化分析亦能反哺文学科研,使人类对诗歌风格的认识更加精细,从而在互动中开创新的风格。
AI能否给诗歌带来革命性的进步?这牵涉到一个两难问题。现周期的AI诗歌创立在对人类已有诗歌的模仿之上,这与真正杰出的诗作必须创新背道而驰。当然,诗歌的创新并不必然寓意着一空依傍。优秀的诗人大都是在继承前人的基本上别开生面,怎样把握继承和创造之间的分寸,必须AI把握审美的能力。换言之,AI不仅要模仿作者,亦要模仿读者。难点在于,审美尚没法被转化为特定规则,亦就难以用来训练AI。处理这个问题,或可先将抽象的审美降解为详细的文体特征,由下而上,逐步构建整体的审美框架。
总之,开发者的重点在于经过将诗歌的文体和风格量化,训练拥有个性的人工智能模型。
3、人类怎样应对AI诗歌
AI诗歌似乎在必定程度上挤压了人类的独创空间,显示相当多的诗在技艺层面是能够批量生产的,仅有部分诗拥有没有可替代的价值。随着AI算法的完善,后者可能会越来越少。人类将怎样应对这一趋势?笔者以为无须担忧,由于:
首要,诗歌是目的性的而非工具性的。图宾根大学哲学系的高语含认为,工具性活动的过程没法给人类带来愉悦,独一的标准是效率,因此呢能够被新技术代替,如飞机引进后,人们不会再坐马车去北京;目的性活动的价值在于本身,人们享受的是它的过程。写诗是出于自我满足和体验的需求,即便无多少人敢说自己超越李白杜甫,亦不妨碍后人继续写诗。这一观点颇为有理,不外,诗歌创作因人而异,如苦吟派诗人“吟安一个字,捻断数茎须”,过程就并不愉悦,倘若其作品能由AI产出,那样这一类诗人最少会失去部分道理。
其次,诗歌是分化性的而非一致性的。人们评估诗歌并无一个固定的标准。在某些文学观念看来,诗歌与私人体验密不可分,如情诗,常常有极强的特殊性,与独特经验关系紧密。AI无此经验,则不可写出这般的诗,即便字句上差相仿佛,对诗的特定读者而言亦是难以接受的。不外,对这类诗的作者,AI能够起到类似古代类书的辅助功效。古人写诗时运用类书,从其中记录的诗句中挑选适当的典故;AI时代的创作者亦能够经过输入关联元素,让AI生成诗句,从中找到妥帖的表达。
最后,诗歌是交流性的而非对抗性的。这与被AI征服的围棋区别。围棋有绝对的输赢。2016年阿尔法狗(AlphaGo)击败李世石,其后阿尔法狗的进化版阿尔法元(AlphaGo Zero)以100∶1的胜率击败阿尔法狗,在围棋行业彻底碾压人类。诗歌不排除竞争,如唐代科举考试以诗取士即为竞争的先例。但诗歌竞争并不表此刻对抗上,如《唐诗纪事》记载上官婉儿评定沈佺期、宋之问诗:
中宗正月晦日幸昆明池赋诗,群臣应制百余篇。帐殿前结彩楼,命昭容选一首为新翻御制曲。从臣悉集其下,须臾纸落如飞,各认其名而怀之。既进,惟沈、宋二诗不下。又移时,一纸飞坠,竞取而观,乃沈诗亦。及闻其评曰:“二诗工力悉敌,沈诗落句云:‘微臣雕朽质,羞睹豫章才。’盖词气已竭。宋诗云:‘不愁明月尽,自有夜珠来。’犹陟健举。”沈乃伏,不敢复争。
上官婉儿认为两诗功力相当,但沈诗尾联“词气已竭”,宋诗尾联则“犹陟健举”。可见,两诗之胜负并不是对抗的结果,而是经过读者衡量得出的结论。沈诗的价值并不因宋诗更高一筹而消失;在更加多的状况下,“文无第1”,参与竞争的诗歌高下亦无结论。因此,AI诗歌并不会威胁到诗人。人们经过欣赏其作品得到愉悦,亦能够借机反观自己诗歌的问题。总之,人类与AI是互补的,而非互斥的。
事实上,诗歌本身就包含着超越人类经验的倾向。罗曼·雅各布森认为,所说“诗性”(poeticity),寓意着词语指向自己而非现实,亦便是说,它应脱离平常经验而存在。奥尔特加·伊·加塞特指显现代诗歌的“去人性化”,“抹去了现世的所有痕迹,展现出完全不属于这个世界的形象”。胡戈·弗里德里希在《现代诗歌的结构》中说得更清楚:
逃脱人类的中庸状态,背离惯常的物象与俗常的情感,放弃受限定的可理解性,代之以多义性的暗示,以期让诗歌作为一种独立自主、指向自我的形成物,这种形成物的内容仅有赖于其语言、其无所拘束的幻想力或其非现实的梦幻游戏,而不依赖于对世界的某种摹写、对感情的某种表达。
虽然这一趋势的出发点在于创立一种超越公众文化的现代艺术,但远离现实描写和情感表达的创作特点契合了AI的特性。可见,AI诗歌不仅是技术发展的产物,亦符合诗歌自己的需求。人类完全能够,亦应当将AI摄入诗歌发展的主流中。
余 论
现周期AI诗歌研发的重点在于“人类”而非“诗歌”,研发者致力于让AI写出以假乱真的诗。但如上文所述,弱AI受限于意欲、情感和平常经验的缺失,在拟真度上很难再有大的发展;强AI自具主体认识,自然持有表达的欲望和能力,“不教而能”,亦无需专门研发诗歌功能——诚如笔者在《人工智能诗歌论》中所说,“真正的写诗能力附庸于强人工智能,无必要花费太大的代价单独研发。在强人工智能显现前一味关注这一能力,恐怕有事倍功半乃至无解的危害”。因此呢,在当下弱AI的框架下,研发者似乎应扬长避短,把开发的方向从“人类”转向“诗歌”,不求AI完全独立写出真假难辨的诗,而是把AI作诗算法看成一种辅助人类写诗的“有益设备”(beneficial machine)。经过AI大数据的优良,人类会对诗歌产生更深入的认识。
其实,在AIGC行业,诗歌恰恰是较易着手的一个分支。自然语言必要思虑实用,在拟真度上有很高的需求。诗歌是一种特殊的文体,其价值重点在于审美而非实用,本身就离自然语言较远,评判标准亦呈现多元化——如上文所举的现代诗,就主张断片化、陌生化、去人性化,远离人类的平常生活,现有AI正好能满足这些倾向。钱锺书在《谈艺录》中说明诗歌在语法上的自由强过其他文体:
捷克形式主义论师谓“诗歌语言”必有明显处,不吝乖违习用“标准语言”之文法词律,能够破常示异(foregrounding, the intentional violation of the norm of the standard, distortion);故科以“标准语言”之惯规,“诗歌语言”每不通不顺(Jan Mukařovsk: “Standard Language and Poetic Language”)实则瓦勒利反复申说诗歌乃“反常之语言”,与“语言中自成语言”(C’est bien le non-usage, c’est un langage dans un langage) 。西班牙一论师自言开径独行(totalmente independiente),也晓会诗歌为“常规语言”之变易(La poesía comomodificatiÓn de la lengua o norma),诗歌之字妥句适(la única expresiÓn propia)即“常规语言”之中不当不适(la “lengua” la expresiÓn impropia)。当世谈艺,多奉斯说。余观李氏《贞一斋诗说》中一则云:“诗求文理能通者,为初学言之亦。论山水奥妙曰:‘径路绝而风云通’。径路绝,人之所不可通亦,如是而风云又通,其为通亦至矣。古文也必如此,何况于诗。”意谓在常语为“文理”欠“通”或“不当不适”者,在诗文则为“奥妙”而“通”或“妥适”之至。
从常规看来不通或不当的用法,在诗歌中常常能够成立。因此,与自然语言区别,在AI诗歌的开发中,求“似”不如求“好”,应该借助AI尽可能地探索诗歌的可能性。
诗歌的价值评判则与读者息息关联。然则,诗歌一样持有“科学性”的一面。无论道理怎样,诗歌必要以文字符号的形式表现,而这种形式区别于平常语言的书写。诗歌的种种规则和技艺,从最基本的诗体、格律、声韵,到较高级的字法、句法、章法,乃至于文字的视觉搭配和语感的听觉组合,都表现了理性的设计。即便是表现诗人自由意志的“破格”,本质上亦受到“格”的限制。如格律上的“破格”,以黄庭坚著名的拗体七律《题落星寺四首》之一为例:
星宫游空何时落,着地也化为宝坊。
诗人昼吟山入座,醉客夜愕江撼床。
蜜房各自开户牖,蚁穴或梦封侯王。
不知青云梯几级,更借瘦藤寻上方。
此诗无正常的律句,每一句都经过拗折,表面上是对“律”的突破,但这一突破恰恰是创立在刻意避开“律”的基本上,表示出作者是一个欲以拗健洗去软熟的老练诗人,而非不谙格律的初学者。倘若一联诗句中,一句拗而另一句不拗,则显然不可视为拗体,只是门外汉的出律之句。可见,形式本身无所不在,极为重要,就像棋的规则构成为了棋艺的舞台同样,“人文性”的诗艺亦必须在“科学性”的形式中展现。波德莱尔对此深有感触:
很显然,格律的规则不是随意发明出来的专制暴政。它们是精神有机体本身所需求的规则。它们从来无阻止原创实现自己,反过来讲要正确得多:它们始终在帮原创走向成熟。
那样,无需格律的自由诗怎样?是不是亦表现了“科学性”呢?自由诗之因此有其独立的存在价值,必然有异于散文的特点,而这一特点,是创立在特殊的语感上。诗人在创作自由诗时,必要调控语言的节奏,换言之,他没法再依赖格律提供的语感,而要自己设计语感。咱们乃至能够说,一首优秀的自由诗,其实遵循的是作者自创的、内化的格律——它依然能够表现“科学性”。
再深入一层看,诗歌的“科学性”和“人文性”亦可能是统一的。诗歌的种种形式,有待于人的审美评判。从这个道理上说,诗歌“科学性”的一面亦服务于“人文性”。而人得到的美学观感,其实亦能够还原为“科学性”的技艺细节。因此呢,拥有“科学性”的AI写诗是可行且有益的,人类可在与其互动的过程中达成“科学性”与“人文性”的结合。
总而言之,AI为人类在“科学性”与“人文性”的探索上开辟了新的境界,而AI诗歌恰恰表现了“科学性”与“人文性”相依相成的辩证关系。
扫码阅读全文
原文《AI技术的意图与审美问题:再论人工智能诗歌》刊于《上海交通大学学报(哲学社会科学版)》2024年第2期(第84—95页)。若下载原文请点击:https://kns.cnki.net/kcms2/article/abstract?v=Y_ITemen1J6CJ0PSkotK8hMGoElTfaIGuiP3mjKq6DZidolfsAXrufFqJn08H9WG71rm-4QYgyqCDhMATXcQDNIgSBvZHrVnvHkNrD8Bh7pvhO4PWVKfVA==&uniplatform=NZKPT
————————
编辑:黄艺聪
审校:孙启艳
|