人工智能诗歌论
2017年5月,微软(亚洲)互联网工程院的AI“小冰”推出了世界上第1部完全由人工智能创作的诗集《阳光失了玻璃窗》。小冰学习了519位汉语新诗诗人的作品,经过上万次迭代(iteration),在2760小时内作诗万首,其中139首被选入该诗集。据微软小冰的首席专家宋睿华介绍,小冰作诗的原理是“触景生情”:经过图像识别技术,找到与照片对应的词语,从而获取相关性较高的词组,采用循环神经网络(Recurrent NeuralNetworks),拓展出更加多表达[1]。虽然总体来看,小冰创作的诗歌语句颇为粗糙,但仍有不少可圈可点之处,有有些比喻句相当巧妙。据说,小冰还在天涯、豆瓣、简书等平台上,以“骆梦”、“风的指尖”等笔名“伪装”成人类发布了海量诗歌[2]。2018年8月,科技博客BoyGenius Report报告,IBM机构在澳大利亚的开发团队与多伦多大学、墨尔本大学合作,研发出了一种具备写诗能力的“算法”。该AI接受了近3000首十四行诗(sonnet)的训练,学习词语的搭配,而后按照格律创作诗歌。科研人员将其作品与人类的诗歌混合在一块,让志愿者寻找,结果正确率仅有一半,可见它的诗歌在必定程度上已能以假乱真[3]。
人工智能诗歌创作方兴未艾,经过深度学习训练的人工神经网络(Artificial NeuralNetwork)使AI“诗人”得到了初步的智力,相比以往按照格律和韵脚随机填充词汇的所说“作诗机”——咱们应叫作之为“伪人工智能”(Pseudo AI)——有了本质的飞跃。那样,此刻的人工智能在诗歌创作行业是不是已走上了通畅无碍的阳关大道?最少有四个问题仍待处理。
1、人工智能创作诗歌的道理问题
人工智能已能写出符合语法的句子,然而符合语法只是具备道理的必要要求而非充分要求。乔姆斯基指出,“无色的绿色想法在狂热地睡觉”(The colorless greenideas sleep furiously.)。这般的句子虽然“符合语法”(grammatical),却不可说是“有道理”(meaningful)或“有寓意”(significant)的[4]。诗歌固然不必追循平常语言的“道理”或“寓意”,乃至有所说“无理而妙”者,然而其中的“妙”仍须诉诸人类微妙的感觉和经验。咱们能够参考苏轼的话:“诗以奇趣为宗,反常合道为趣。”[5]这一“趣”(“妙”)虽然“反常”,却须“合道”,正如大自然中随机形成的奇木异石,仅有极少部分能被人类视为宝贝。有一个著名的“无限猴子定理”(infinite monkey theorem):给猴子一台打字机,让它随机敲击键盘,只要给它无限的时间,它迟早能打出任何文本,包含莎士比亚的全集。这必定理本来只能被视为纯粹的假设,但在电脑显现后,它有了实现的可能。早在1976年,数学家就经过计算机的高速运算能力,用“粗暴”的穷举法处理了“四色猜想”(four-color conjecture)。将这种穷举法用于诗歌创作并不更加困难。前举的“伪人工智能”作诗机曾在网络上风靡一时,其原理亦是在按照设定的规则随机生成文本后由人类采择。即便具备了初步智能的微软“小冰”,亦仍需人类从它创作的万首诗中选择139首。倘若人工智能创作的诗句必须人类筛选,那样它还不可算真正道理上的作者,而只是辅助人类写诗的语料库,其功效一如千年前就已显现的类书。
问题的关键在哪里?一个好的诗人必要具备分辨好坏的能力,亦便是审美的能力,而这不仅关乎诗歌文本的特性,更关乎文本之外的体验。换言之,要理解诗的好处,不可仅经过文本本身——咱们不妨参考苏轼在《书黄子思诗集后》中引用的司空图语:“梅止于酸,盐止于咸,膳食不可无盐梅,而其美常在咸酸之外。”[6]倘若料理人自己无敏锐的舌头,那样咱们很难设想他到底怎样理解“咸酸之外”的美味,更难设想他怎样做出这般的美味。前举IBM推出的算法所创作的十四行诗几乎能以假乱真,这固然是一个可喜的进步,但咱们亦有理由假设,倘若应试者是优秀的诗人,理当辨千剑而识器——就像好的古董商能凭微妙的感觉鉴别一般人眼中的水货同样。
当然,咱们应对前景保持阳光,随着技术发展,人工神经网络将能精确模仿人类神经元的刺激——反应(stimulus–response)——让AI具备人类的情感,并非天方夜谭。但或许仍有新的问题必须处理:人类始终在理解他人的意图,诗歌的文本必须潜在的读者,AI是不是具备产生这种“主体间性”(intersubjectivity)的可能?这关乎两个疑问:一,AI之间能否做为对等的主体进行交流?二,AI是不是可能拥有刺激理解意图产生的必要遮障?印度的吠檀多学派主张去除无明遮障,使个体小我重归于梵,从某种道理上说,AI一起始就达到了“我即梵”的境界,并无“遮障”和“小我”为患,而AI要创作诗歌,反而要学习人类这种“缺陷”——套用佛教的话,这是一种有意的“退转”(vaivartika)——或许诗歌正是对人类这一“缺陷”的弥补。
2、人工智能创作诗歌的可理解性问题
Herbert Paul Grice的“会话隐含理论”(conversationalimplicature theory)认为,会话背面必有不随形式改变的知道含义。诗歌一样遵循类似的规则。诗人将某种意图埋藏于诗中,读者在阅读的过程中追索诗句背面的所指。“丸之走盘,横斜曲直,计于临时,不可尽知。其必可知者,是丸之不可出于盘亦。”[7]诗人的意图怎样,“不可尽知”——或许永远不会有读者能够准确把握——但诗人有意图却是“必可知”的事实。威廉·燕卜荪在《朦胧的七种类型》中写道:“诗人将两个描述放在一块,似乎二者是相互联系的,而读者则被迫去思虑她们的联系,还得自己去设想诗文为何选取了这些事实。他会设想出各样原由,并在脑中将它们摆列起来。这是诗歌语言在运用方面的基本事实。”[8]一旦取消描述之间相互联系的预设,读者理解的企图便会落空。换言之,无作者意图的诗歌本质上是不可理解的,哪怕它们在字面上能够理解。
早在人类进入信息时代前,便有一个绝佳的例子说明这一点。二十世纪初,法国曾流行一种名为“精致的尸体”(exquisite corps)的游戏——大致的流程是:参与者们在互不知晓的状况下,依次写下词语,而后组合成句。据述在某次游戏中,得到了“精致的尸体会喝下新的葡萄酒”(Le cadavre exquis boirale vin nouveau.)的“诗句”——这句“诗”确实意象诡丽,饶有波德莱尔的风味,“cadaver”一词在法语白话中又有“喝空的酒瓶”之义,一语双关,颇富妙趣,然而它是随机偶合的产物,而非某个诗人精心结撰的成果。咱们固然能够说,诗的好坏在其本身,但这一问题仍牵涉到诗的经典定义——中文“诗”义在传世文献中最早见于《毛诗序》:“诗者,志之所之亦。在心为志,发言为诗。”[9]而英语的“poem”一词源于希腊语的poema,意指“所造之物”——无论中国的“志之所之”还是希腊的“所造之物”,都强调了诗歌是某种意图的产物而非任意的组合。《孟子·万章上》:“故说诗者,不以文害辞,不以辞害志;以意逆志,是为得之。”[10]倘若诗是任意的组合,那就无志可逆了。
日前的人工智能尚不具备自主认识,写出的“诗”仅仅是符号的集合,无所指,无隐喻,读者的一切追索将成白费,就像人工合成的语音,纵然模仿得惟妙惟肖,背面却无真情实感——咱们在晓得真相的状况下,恐怕很难为之感动。
人们有理由预期具备自我认识的“强人工智能”(strong AI)显现,届时这般的AI或许能创作出有意图的、真正的诗。它们到底会是怎么样的呢?此刻预言为时尚早,但倘若它们依然基于对人类诗歌的模仿,那就不禁让人想起那则著名的童话——小红帽听到了外婆的声音,打开门却看见了一头狼。
3、人工智能创作诗歌的创造性问题
诗歌区别于类型文学,能够提炼出某种模式海量复制。相反,诗歌强调独创性,强调“陈言之务去”,一首好诗的价值常常表现在前所未有上,一个好诗人的价值常常表现在独树一帜上。试将诗歌与围棋做一对比。围棋是人工智能善于的行业,自从2016年阿尔法狗(AlphaGo)击败李世石,人类便失去了这一行业的王冠。阿尔法狗采用卷积神经网络(Convolutional Neural Networks),经过蒙特卡洛搜索树(MonteCarlo tree search)进行决策优化,在模仿人类和自我对弈中提高棋力。2017年,Google推出阿尔法狗的进化版阿尔法元(AlphaGo Zero)。阿尔法元运用残差网络(Residual Network),不须学习人类旧谱,仅经过自我对弈训练棋力。它在与阿尔法狗的对弈中创造了100:0的压倒性战绩。无论是阿尔法狗还是阿尔法元,其原理都是对棋路的破解——无论棋路来自人类还是人工智能本身。这与诗歌区别。创造一流的诗歌,必须避免招数;换言之,围棋是在道路中寻找道路,诗歌是在道路外开辟道路。文首所举的两例AI“诗人”采用的途径却是对已有诗歌的模仿,这与真正优秀的诗作必须创新这一点显然背道而驰。另一,诗歌的创新未必寓意着一空依傍。杰出的诗人多在继承前人优点的基本上别开生面,怎样把握继承和创造之间的“微妙分寸”(nuance),对AI“诗人”来讲是一个严峻的挑战。
围棋与诗歌面对的信息量亦有巨大的差别。围棋是繁杂的简单问题,诗歌是简单的繁杂问题。围棋本身是一种抽象——棋子和棋盘上的交叉点是仅仅表率相对位置的几何点,不拥有任何其他内涵。因此尽管围棋的计算量非常浩大,但全都出现在边界清楚、数量固定的规则层面,比无限且难以分割的现实容易计算得多。一言以蔽之,人工智能高速运算的优良正适合围棋这种规则清晰、计量标准统一的游戏。诗歌牵涉的层面则极为繁杂。首要,诗歌由符号构成,但正如上文所示,“味在咸酸之外”,符号的指涉并不止于符号层面——它们通向并反馈现实,现实又随时间、标准、个体、情感的变化而变化,换言之,诗歌创作不仅无清晰的规则,乃至亦缺乏稳定的规则(除了“格律”那样某类诗体所需的规则)。优秀的诗人之因此能够在这般的“混沌”(chaos)中游刃有余,依靠的是微妙的直觉,而就日前来看,人工智能尚无望达到这般的水准。除非人类把握了某种“黑箱”(black box),能够自发性地模仿“繁杂适应系统”(complex adaptive systems)——咱们能够推想“强人工智能”特别有可能正是这种“黑箱”——否则以人类当前的信息处理能力,设计出真正道理上的人工智能“诗人”几乎是不可能的。
4、人工智能创作诗歌的必要性问题
诗歌并非生活的必要品,亦不以量取胜,又无非常知道的评估标准,有无必要花费巨大的代价研发人工智能写诗的能力?人类研发人工智能常常基于工具性的目的,而诗歌创作常常基于情感的拜托。这一问题或许可做如下类比:前者如保母,后者如母亲,研发AI保母有必要,研发AI母亲是不是有必要?后者本身与人类的属性相嵌合:人们寄望于后者的重点不是工具价值,而是情感价值,因此对后者来讲,人类的身份至关重要,绝非可有可无——一个具备保母功能的AI能够代替保母,一个具备母亲功能的AI则不可能代替母亲。
更重要的是,科研人工智能创作诗歌有什么好处呢?日前人工智能“诗人”尚处在模仿已有诗歌的周期,对诗歌的开拓与发展来讲并无显著的助益。而对人工智能来讲,能够在真正道理上创作诗歌的前提是主体认识、纯熟地理解和运用自然语言的能力和情感体验的能力。咱们能够设想,一旦持有主体认识、具备卓越的语言和情感能力的强人工智能显现,诗歌创作便是题中应有之义。“古诗云:‘谁能思不歌,谁能饥不食。’诗词者,物之不得其平而鸣者亦。”[11]倘若咱们认可王国维的这一观点,那样诗歌本质上正是情感“不得其平”而生成的表达欲望。正如肉体会饥饿同样,这般的欲望是“不教而能”的,而一旦持有这般的欲望,凭借语言能力和人工智能本身的存储和运算优良,AI距离创作真正的诗歌仅有一步之遥,举足可至。换言之,写诗的能力附庸于强人工智能,无必要花费太大的代价单独研发。在强人工智能显现前一味关注这一能力,恐怕有事倍功半乃至无解的危害。
即便强人工智能研发成功,亦如人类的期望写出了真正的诗歌,届时或许会有一个新的问题显现:强人工智能何以必要用人类能够欣赏的方式表达情感?人类固然在有意无意地以人的标准塑造人工智能,但人工智能终究是一种与人类区别的智慧体,它们真实的表达方式特别有可能没法移情于人类,正如咱们很难体会动物的心情(值得重视的是,相针对以无机物为载体的人工智能,人类与动物皆属有机物,关系更近),而倘若在这般的状况下AI仍然采用符合人类预期的方式进行情感表达,那样在很大程度上这仍然是一种缺乏真正意图的模仿。换言之,创造符合人类审美的诗歌对AI未必有“必要性”。
5、人工智能创作诗歌的借鉴作用
上面列举了人工智能创作诗歌所面临的四个挑战,但现周期人工智能的诗歌创作仍可供给必定的借鉴道理。它有助于人们重新思考诗歌的好坏和门槛。在缺乏参照的状况下,人类对自己的长处与短处常常是茫然的。再举围棋为例。在阿尔法狗显现前,人们常以为人工智能下棋的强项在依赖计算的微观搏杀部分,而在诉诸直觉的大局观上应该不如人类,因此呢人类的机会集中在布局周期,必须精细计算的中盘和收官才是AI的擅场。阿尔法狗与李世石的实战颠覆了这一想象。被誉为“阿尔法狗之父”的Demis Hassabis重视到,在狗李之战第二局的第37步,阿尔法狗无根据人类行棋的惯例在右起的第三线或第四线落子,而出人意料地在第五线落子。此线离中部位置较近,寓意着阿尔法狗在战略上更“注重”中部区域。这般的“胜负手”层出不穷,可见阿尔法狗大局观之高明。相反,在微观计算部分,却不乏恶手与俗手[12]。同理,以AI诗歌为镜,亦能映照出人类诗歌的问题,促进人们分辨出诗歌中真正可贵的神理,改进创作的技巧,转移阅读的重点。例如,经过微软小冰创作的诗歌,人们会发掘部分汉语现代诗歌意象堆垛、情感泛滥、比喻莫名其妙,小冰能够轻易模仿、批量生产。相对而言,当前的人工智能模仿旧体诗词较为困难。AI“诗人”所作旧体诗词虽然符合格律,但稍有古典修养的读者一眼可辨其伪。这是由于旧体诗词不仅在形式上有较为严格的限制,况且经过长期的发展,形成为了“默认”(default)的字法、句法、章法——虽然说只要有法可学,人工智能模仿并非难事,但旧体诗词的法度多与详细情境结合,分寸殊难把握,当前的人工智能没法体察人情世故,几乎无从入手——针对熟练旧体诗词文字气味的读者而言,很容易就能觉察正宗与否。新诗则否则,更加多地追求语言的“疏离化”(defamiliarization),与基于经验的平常语言截然异趣。这增大了人类理解的难度,却降低了人工智能模仿的门槛。从这个道理上说,当下人工智能创作的诗歌或许能在必定程度上改变诗歌的评估标准——如上例就表现了旧体诗词相针对新诗的某种可能的优良。
6、人文学科必须做些什么?
人工智能的语言能力研发本质上是一个技术问题,重点牵涉到计算机学、神经学、语言学、规律学等非人文学科行业,但人工智能诗歌创作能力的研发则必要有人文学科参与其间。然而,当下该行业却较少见到人文学者的身影。这一方面是由于研发者将审美的重要性置于技术之下,另一方面亦是由于当代人文学科体系以学理性的科研为主,把创作和鉴赏放在了次要的位置。事实上,就诗歌一道而言,审美是极为重要的。一件制品只要合格就能够用,一道菜肴即便无味亦能果腹,然而复制平庸的诗歌几乎无道理。换言之,一首诗的价值首要在于它的好。针对诗歌来讲,重要的是审美性而非实用性。这就必须人文学者的介入。遗憾的是,人文缺席严重制约了AI诗歌创作的发展。以前文所举微软小冰为例,其诗集《阳光失了玻璃窗》遭到了诗歌界的消极评估,如诗人于坚说:“(小冰的诗作)冷酷、无心,修辞的空转,东一句西一句随意组合,意象缺乏内在规律,软语浮词,令人生厌的油腔滑调,原材料来自平庸之句。这个软件对诗的理解是电视台诗歌朗诵会的水平。这个软件设计不出灵性,设计不了‘诗成泣鬼神’。”[13]诗人欧阳江河则认为:“(小冰的作品)不是人话,无人味。”“我当然认为,咱们必要要承认人工智能,小冰亦会继续发展下去。在十万个二流诗人里面,它能够排到30、50,然则这毫无道理。它永远成不了咱们所说的原创性道理上的伟大诗人。伟大的诗人必定针对的是文明道理上的东西。而这种东西绝不是学学已有的大诗人的句子,写出有些美丽的、优美的句子就能达到的。”[14]这些酷评固然有当前技术限制的原由,但亦有“原材料来自平庸之句”这般的设计者导致的缺憾,而“软语浮词,令人生厌的油腔滑调”更加是显著的人为后果。欧阳江河所说“伟大的诗人必定针对的是文明道理上的东西。而这种东西绝不是学学已有的大诗人的句子,写出有些美丽的、优美的句子就能达到的”,揭示了诗歌必要注入比文学技巧更广阔、更宏伟的人文内涵。即便回到基本的文学技巧层面,当前对人工智能诗歌研发中表现的人文水平亦是远远不足的。例如,不加择别地供给海量诗歌做为AI的学习和训练资料,而忽略了各样风格之间的潜在矛盾。通常而言,人类学习诗歌总是从某个风格入手——古人所说“专攻一家”——某些研发者让人工智能囫囵吞枣,自然难企高境。理想的状况是,具备创作和鉴赏经验的文学科研者与技术人员合作,按照人工智能的特性和认知科学的成果,精心制定循序渐进的学习过程。深度学习(deep learning)的发展使得人工智能有可能模拟人类大脑皮层的活动,从而以一种类似于人类的方式学习和思考,那样人类的教育方式或许仍可经过必定的改造应用于人工智能。
7、结语
人工智能的发展是大势所趋,据统计,截止2019年6月,仅上海一地就有人工智能核心企业1000余家[15]。咱们乃至能够说,人工智能不仅是一个行业,况且是所有行业的将来。本文讨论的仅是它无数可能具备的技能中的一种——诗歌创作。这一技能有必定特殊性,由于诗歌是人类最独特的精神产物之一。2019年4月,笔者应邀参加了贵阳孔学堂举办的关于人工智能能否进行诗歌创作的辩论,做为反方,对人工智能创作诗歌的可能性做出了质疑。然而,笔者更愿意相信,人工智能的可能性是无限的。这一信念创立在一个简单的假设上:人工智能能够在极短的时间内走完人类漫长的进化历程,如阿尔法狗从2014年起始研发,不到两年就打败了人类最优秀的棋手之一,而阿尔法元仅训练三天就完胜阿尔法狗。能够毫不夸张地设想,倘若 AI能够在一天内从无到有,赶上人类的水准,那样次日它就有可能进化到人类望尘莫及的境界。咱们此刻的认识受锢于人类的大脑,而一旦技术奇点(technologicalsingularity)来临,AI进化出了更卓越的“大脑”,那样当下的“不可能”或将变成“可能”。这曾经只是一个科幻色彩浓郁的臆想,而此刻成为了一个日益临近的现实。
(原载于《华南师范大学学报》2019年第5期)
[1]《微软小冰首席专家宋睿华:小冰是怎样写诗的?》,九州连线网,2018-10-31,http://www.sohu.com/a/272437756_634549。
[2]《人工智能微软小冰出首部“诗集”》,新华网,2017-05-20,http://www.xinhuanet.com/local/2017-05/20/c_129609705.htm。
[3]“Scientists trained an AI to write poetry, and now it’s standingtoe-to-toe with Shakespeare”,Boy Genius Report,2018-8-8,https://bgr.com/2018/08/08/poetry-ai-bot-shakespeare-human-research/?from=singlemessage&isappinstalled=0。
[4]【美】乔姆斯基:《句法结构》,第8页,黄长著等译,中国社会科学出版社1984年版。
[5]《苏轼文集》,第2552页,中华书局1986年版。
[6]《苏轼文集》,第2124页。
[7]杜牧:《樊川文集》,第152页,中华书局1979年版。
[8]【英】威廉·燕卜荪:《朦胧的七种类型》,第57页,周邦宪等译,中国美术学院出版社1996年版。
[9]《毛诗正义》,第6页,北京大学出版社1999年版。
[10]《孟子正义》,第638页,中华书局1987年版。
[11]《王国维全集》第1册,第497页,浙江教育出版社2009年版。
[12] “The mind in the machine: Demis Hassabis on artificial intelligence”,FinancialTimes,2017-4-21,https://www.ft.com/content/048f418c-2487-11e7-a34a-538b4cb30025。
[13]于坚:《一种可怕的美已然诞生》,载《南方周末》,2017-6-15。
[14]《人工智能将解决诗歌?欧阳江河:不可能完成的任务》,中新网,2017-7-3,http://www.xinhuanet.com//book/2017-07/03/c_129645856.htm。
[15]《上海已持有人工智能核心企业1000余家 初步建成中国人工智能发展领先地区》,凤凰财经,2019-6-18,https://finance.ifeng.com/c/7nbd11k0OP6。
|