源自:爱范儿
始终败兴,大模型常常以「文科生」的形象为人所知。从写周报、邮件,到辅助写学术论文、法律文书,这类事务型写作由于规则和用途知道,尤其能让大模型发挥自己的所长。
可正是这些高度规则化的写作里,容不下错误。
与事实不符、凭空生造内容、不按用户指令输出等等,这些都是大语言模型经常会显现的「幻觉」,是日前最让工程师和用户都头疼的问题。
然而,在另有些人眼里,「幻觉」和「生成」相伴相生,寓意着设备亦在创造。
去年十月,第五届江苏省青年科普科幻作品发布获奖作品,评审们惊奇地发掘得到二等奖的《机忆之地》,是一部完全由 AI 生成的短篇小说。
作者是清华大学数据资讯教授沈阳,创作中他和 AI 来来回回对话了六十多轮,连笔名都是 AI 起的。
一样是去年,GenWorld 联合 Hugging Face、真格基金,办了两届「中文 AI 微小说大赛」。区别于沈阳的匿名投稿,微小说大赛不仅明文规定了要用 AI ,况且要全都用:不准许人为对文本直接进行润色和加工,修改都必须经过 prompting 完成。
全文都靠生成并不是件容易的事儿,毕竟大模型的幻觉完全不可控,哪怕是同一套描述词,每次输入后,返送的结果都会有所区别。
选手们很大都是程序员出身,因此呢显现了千奇百怪的「创作法」,除了写作工具,还用上代码、excel 帮忙,都是为了尽可能掌控住 chatbot 的表现,稳定输出品质。
能够说,选手们是在经过模仿 AI 的写作方式,理解它的规律,从而达到强化掌控的效果——这多少有点倒反天罡了。
现周期,有一个事实不得不面对:AI 写作能很好地完成事务型写作(邮件、文书、文案等等),但在故事写作上,有很大的局限。
一个西班牙团队不久前做过科研,请来了一位屡获殊荣的西语作家 Patricio Pron,直接和 GPT 打擂台比赛写标题,并找了专业的文学评论家来打分。
职业作家在创意、文学性、风格化方面,都得到了更高的分数。当两边的成品放在一块时,很显著能看出差异。
部分标题摘录
「GPT 写标题的形式基本是同样的,xx的xx,作家起标题在形式上来讲就完全不同样。」一样亦是小说家的慕明,亦和科研中的专家评审有相同的看法,她分析道,「例如这个 Dont tell mom,可能是一个类似小鬼当家的故事。人类作家能从已有的例如电影、小说中得到启示来取名,人类的读者亦能get到这种启示,这基于的是作者和读者之间,一起阅读和观影经验。」
从 2016 年起,慕明起始尝试写科幻小说。去年她出版了自己的小说集《宛转环》,入选了 2023 年单读书店文学奖,选篇《涂色世界》曾得到第 31 届中国科幻银河奖,去年改编为短片,收录至由 B 站出品的《明日存活指南》系列剧集中。
在写字之前,她在谷歌微软写代码。慕明本科毕业于北大智能科学系,后来去了宾夕法尼亚大学科研设备学习,再后来顺理成章地做了工程师。
慕明
科幻阅读始终是她的兴趣,包含科普。她对技术的认识,亦让她比公众更早接触 GPT 所生成的「文学」。
她回忆起 2017 年,「还无 GPT3.5 的时候,有有些更早的尝试,例如微软小冰的诗集,还有陈楸帆的《人生算法》里放了一段由 AI 生成的文案。」
在那时,AI 写作还是一个小圈子里的鲜嫩玩意,是实验品——尽管在当时,就已然有了令职业作家感叹的成果。
2023 年,慕明的工作起始涉足剧本创作。虽然已然写了好几年小说了,但她在剧本写作方面无任何经验。她给自己找了一位「同事」,亦便是 ChatGPT。
最起始慕明亦担心过,ChatGPT 是不是真的能够胜任,在向影视行业的伴侣咨询认识之后,她起始和这位「新同事」合作写剧本:由她提供核心创意,再经过 prompt 让 ChatGPT 修改,并且反复迭代。
短片《涂色世界》剧照
这个过程其中,事务型写作里让人避之不及的「幻觉」,反而成为了让慕明更意外的东西:在她的小说《铸梦》里有一段场景,写的是一只人偶在宴会上起舞,送进Mid-journey中生图之后,反复扩图几次,模型给出了意外贴合故事设定的「理解」:宴会的舞台是在水下的,人偶和人隔着一个反光的水面,亦像极了二者之间互相映照的关系。
哪些经历被她叫作之为「顿悟时刻」。
高层工作,还是人做的比较好
看上去,慕明跟这位「同事」合作的不错。进入 2024 年后,各家模型持续迭代,有了更长的上下文空间,有了更敏捷准确的反应。
但慕明与 AI 的合作却放慢了速度。
剧本和短片工作告一段落后,慕明回归到科幻小说写作,把有限的时间花在自己更珍视的创作类型上。虽然剧本写作亦要「讲故事」,长篇小说却需要截然区别的技能——而日前 AI 并不足以胜任。
「最起始从事剧本或做图等工作时,我觉得 AI 是我的导师或领路人。但此刻回到写作方面,我能清楚地认识到它的局限性。」
此刻在慕明眼中,大模型工具更像是一个「搭子」。有点经验,有点聪明,但都不多,「最大的功效是能够督促我每日一块工作。」
她认为大模型确实有抽象和提炼的能力,然则在文学性强的作品面前,「这个能力还是比较弱的。」
「让大模型来做阅读总结,可能会好些。例如说论文,本身的格式就非常知道,篇幅亦不会特别长,是很结构化的长文本,标出来了这块是结论、这块是实验办法、这块是数据分析。」
然则小说不是那样结构知道的东西,她说到自己用过一个美国的辅助写作软件sudowrite,能够按照详细的需要生成段落,「例如 describe,便是在写到某一段的时候,作者需要一个描述,输入 prompt 进去就会得到一个生成的描述。」
Sudowrite 界面
这亦是此刻许多 AI 写作助手制品的思路:拆解写作中触及的过程,而后由作者提出需要,生成一个能够用来填充的段落。
只是这种做法能起到的效果亦特别有限,「咱们能够举个极端的例子,例如一部 100 万字的长篇小说,光是把每一个场景都拆分出来,这个工作量都已然很大了。假设这些场都由 AI 来生成,这个问题会变得很繁杂。」
先拆解、再填充的做法,必定程度上亦是一种「拉表格」思路:每行是一个需要点,每列是一个处理方法,需要新的处理方法,就再开一列。
然则小说并不是这般写的。
「写小说最困难的还是整体的结构,这个结构包含情节,亦包含名人性格的转变,」慕明说,「还包含了全部叙事方式的选取,视角等等。这些大框架或说高层的工作,此刻看来还是人做的比较好。」
是大模型训练的还不足吗?参数不足多?架构不足好?
「Transformer 架构本身是有问题,例如 attention token length 不足长,这是算法本身的局限。但模型运用的语料亦会产生有些影响,只是因为它是大模型,运用了海量语料,很难评定某个特定语料对其表现的影响程度。」
AI 所不持有的
归根到底,大模型在运用的,是一套截然区别的「写作思路」。
慕明从 2016 年起始写小说,第1周期的学习是从爱好的作家入手,观察分析,把科研出来的写作技巧和原则,经过仿写运用到自己的创作中。
最初她很是受到刘宇昆和特德·姜的影响,「刘宇昆善于运用 confluence 的技巧,合流。而特德·姜更善于推演出抽象的概念,他会创作出一部思辨寓意很浓的小说,跟传统小说区别,然则依然有很强的叙事动力。」
特德·姜
后来她的阅读范围越来越宽广:勒古恩、阿特伍德等作者的作品,体量足够大,足以完成世界观的建设,同期又创立在一个足够有故事性的题材之上。
海量摄入之后,便是持续地写,而后参加比赛,得到反馈,思考,调节。「我会起始思考,我投的比赛或遇到的读者,是不是和我写作时想象的读者一致?或我的读者是不是从我这儿得到了她们想要的东西?倘若不同样,怎么弥补这个差距?是需要去找区别类型的读者?还是要调节语调或故事的形式?」
慕明学习写作的过程,有一个知道的周期划分,区别的周期有区别的目的任务——换个方向想,AI 亦是一个善于根据计划、逐步实现的思维模式,不是吗?
「AI 在过程划分方面的能力是比人类更强,尤其是在给定了框架的状况下。然则我想强调一点:在学习方面,倘若对比我的经验来讲,我的意图是知道的。」
慕明所指的,是 AI 并不持有主观能动的意图。这包含两方面:一个是作者的写作过程中的意图,亦便是写作的成长路线,一个是详细作品中的意图,亦便是详细作品的主旨。
「意图」这是美国哲学家丹尼尔·丹尼特提出的概念,德国生物学家维尔纳·西费尔在《叙事本能》里,用这个概念来解释人脑是怎样运用「意图」来理解自己的生活。另一个重要的概念是「前景化」:在海量的信息里,怎样凸显和前置某有些特定的信息,实现重视力的引导,和信息的排布。
「我晓得我爱好这个作家,因此我要去多读类似的东西;我想这个可能对我写某个东西特别有帮忙,那我就去再瞧瞧更加多的例子。针对我来讲,每一个周期的意图都还比较清晰。这个跟大模型可能不太同样,意图是很人为、主观的。」
现周期基于大模型的写作工具,包含泛用型 chatbot 所供给的写作辅助服务,都创立在用户做为主体,而 bot 只做为执行,它不可亦没法持有自己的意图,更难以实现有侧重的处理信息。
这天然限制了模型在故事创作方面的发挥:哪些基于「幻觉」所偶尔冒出来的段落、灵感,并不足以支撑完成一个有篇幅、有走向的故事。
这就引起,AI 写作工具要么是在堆砌素材,无限流似地生成、叠加、拼接在一块;要么是在无序地编织一个故事。哪些人类能够容易感知到的、由情节和角色推动的故事进程,在 AI 这,成为了偶尔得之的「幻觉」之笔。
这般组织信息的方式,显出过于随意了。「在现代小说中,所有材料都需要一种组织方式,」慕明说,「可能不是传统的线性组织。然则细节和素材,都需要去围绕故事的主题,或内核服务。」
「文学里有一个著名的说法叫契科夫之枪:倘若你在小说开头写了一把枪,那样它必定是有功效的,后面必定要开出来。在文学中,这种处理信息的能力或倾向,装扮着非常重要的角色。」
契科夫之枪,原意为:倘若在第1幕写了一把枪,在第三幕需要让这把枪开火
故事是生活的一部分
透过小说,慕明想象过一种她心中的人工智能:和眼前基于大语言模型不太同样的一种。
她更认同由神经学家达马西奥提出的心智模型:外边环境刺激心情,感受将心情反应带入认识,整合完成后,即时的自我认识生成为了,长时间的经验和记忆会继续整合,从而形成连续的自我认识和身份。
达马西奥表率作《感受与认知》
一种相对「老派」的路线,达马西奥的理论依然把心情和感受做为基点——而这恰恰是文学创作的根基。
「对我来讲,当我有了某种感受——例如我觉得一个东西特别有意思——我就想写故事,把它更清楚地表述出来,让更加多人晓得。这是一个写作的动力。」
事实上,非常多的文学创作常常亦是出于一种知道而激烈的心情:无力、心碎、愤怒、悲哀,等等等等。
这些心情并非凭空冒出来,而是在人经历过事情之后,被激发出来。而反复经历,反复卷入一桩又一桩的事件其中,便是命运。
余华曾经说过,AI 能够表达人类的想法,却没法表达命运的想法。
文学性的写作是一个如此有整体性、有机的过程,它创立在经历与体验之上,由心情和感受激发,在纷杂的讯息中找出最合适的故事做为器具,再把一切和盘托出。
这项工程静悄悄地出现在作者们的脑海里,顶多只听得见敲击键盘的响动,可是其本身浩瀚又繁杂,遣词造句不外是其中的一个过程罢了。
慕明最后引用了一段诺贝尔文学奖得主奥尔加·托卡尔丘克的获奖词,她相信,每一个想要弄懂自己生活的人,都在「书写」自己的故事:
「哪怕当咱们阅读哪些最形式主义的、词句简洁的故事时,咱们亦不可不问:为何会这般? 这是什么意思?这有什么道理?这会带来什么后果?咱们的思维特别有可能在持续地给予百万个围绕着咱们的刺激的解释时,以一种‘故事’的方式进化了,以至于咱们在入睡时,亦始终在一直地继续咱们的讲述。
因此,故事是一种在时间中编织起无限量信息,打开它们向过去、此刻、未来的通路,把握住它们的每一次再现,并将它们安顿在因果类别中的一种方式。理智和情感都参与其中。故事最早的发掘之一便是命运,这一点不足为奇。命运虽然让咱们觉得恐惧和不人性,但它将秩序和稳定带入现实。」
|