2016 年,由人工智能撰写《电脑写小说的那一天》小说成功经过了日本「星新一文学奖」的初选;Sony 研发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让她们以为这便是巴赫自己的创作。
如今,人工智能已然能生成真假难辨的视频,极具艺术感的图像。
人工智能正在挑战着文学、音乐、绘画、影视等等这些本来属于艺术创作的行业。当艺术难以作为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被解决的堡垒。
诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以白话的形式流传在文明里。它在形式上考验节奏和韵律,在表达上考验想象和凝练,它必须表达者把经验、观察、认识结合,毕竟诗歌的创作依托于于人类特有的通感,因此呢咱们能够让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而没法和人类在当时当刻,设身处地看到独一无二的月亮。
然则,倘若 ChatGPT 有了能「看到」月亮的能力,给它思考赋予观察呢?
基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和研发者鼓捣出了一台设备:让摄影机去「所见」,让人工智能去「所感」,用技术的手段去实现文学里最难以量化的表达。
这便是诗歌相机(Poetry Camera)。
相机与诗
诗歌相机内核搭载了树莓派,一个仅有信用卡体积的微型电脑,得以影像和调取 GPT-4 的 API,这就打通了设备的「眼睛」和「大脑」。
举起诗歌相机,随便拍下一张照片,计算机视觉算法会起始分析视觉数据,人工智能模型起始解释图像,识别图像里关键元素、颜色、环境、影调心情等信息,生成诗,并且以类似超市收银条的方式打印出来,就好似拍立得「洗」出照片同样。
拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。不看宣传看效果,它能生成怎么样的诗歌呢?
图源:TechCrunch
有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是:
镜头后面,一人调节视线,
在正方范围里的像素空间。
……
日光透过褪色的薄纱,
他手上,温热的咖啡流转。
对话传出,跨过虚拟的边界,
他的倒影镜像,在屏幕上显现。
书架上,书本倾斜,无声的喋喋不休,
茂盛的植物,是独一的生命。
戴着眼镜,家成为了他平静的面糊,
在这堵墙里,他的世界四散开来。
在 2024 年 4 月的一个清晨,
一种新的常态,悄悄地磨损。
@poetry.camera
不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的「意象感」。诗歌相机的原文更显用词文法上「刻意地精妙」,例如每一段都在押韵脚,例如第1段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用词上亦会采用诗歌用词,例如把 morning 写成 morn,就像中文里把「早上」写成「晨」同样。
图片源自:TechCrunch
另一演示则是对着纽约公共图书馆的天花板拍张照,它会诠释并创作出:
「天花板的影子之舞,
如同金镶木,
用春日天空诈骗了眼睛
石碑和木梁下
伫足」
两位研发者暗示,因为诗歌相机的开源属性,用户其实能够按照个人爱好更改源代码,重新编程和选取区别的诗歌形式,不局限于现代自由诗,亦能够是日本俳句或七言绝句,后续可能会给用户区别大模型去选取,例如从 GPT-4 换到更善于理解文字和语义的 Claude,或更善于写故事的 Dragonfly。
两位研发者暗示「只想享受科技的乐趣」|图源:Poetry Camera
况且诗歌相机不会以任何数字方式保留,用户既看不到相机拍到了什么,亦不可直接复制粘贴文本,倘若想留存一份,只能拿起手机拍下来这一张诗条。由于两位研发者认为,除了技术问题(必须服务器和云平台)、隐私问题之外,诗歌的瞬时性给它增添了额外的道理,打印出来的「诗条」是瞬时捉捕,随机生成,独一无二的实体存在。
在屏幕主宰咱们平常生活的当下,诗歌相机这种设计把视觉以诗意用理学的方式呈现,让它在数字之外,增添了一丝模拟化的浪漫气息。
你我都能做
「拍下所看到的景观,让相机生成诗歌」这一想法不仅富有创意,似乎看着还挺难实现的?但实质上,你我都能够做出一台诗歌相机。
诗歌相机到此刻亦还停留在一个「艺术项目」的周期,两位研发者亦暂未有大规模商场化的计划。她们只是产生诗歌相机的想法,鼓捣出了一台能实现想法的硬件,她们所用到的软硬件都是开源的,因此呢两位研发者选取在网站上把仔细的制作过程公开,鼓励更加多的用户 DIY 自己的诗歌相机。
诗歌相机的内核是微型卡片计算机树莓派,再附以有些平常配件,再加上树莓派的相机模块、一台迷你热敏打印机、六个电池、一个按钮就够了。
官方把仔细的 DIY 教程发到了 GitHub|图源:Poetry Camera GitHub
而诗歌的生成则要对接到 ChatGPT-4 的 API 密钥,在按下快门时,会触发脚本,把采集到的照片发送到 GPT-4 上创建一首诗,最后在热敏收据打印机上打印出来。
两位研发者已然写好了全流程脚本,只要根据她们给的仔细过程逐步设置,不必须会编程和 3D 打印,纸壳里亦能造出一台诗歌相机。
两位研发者的调试用机|图源:flomerboy
倘若说乔布斯所信奉的「技术和人文的十字路口」让他造出了极具美感的数码制品,那诗歌相机则是用一种互动形式上的创新,给予咱们另一种技术和现实交互的可能,突破界限,创造新的表达形式,乃至进一步反向激发人类的观察和想象。
这亦是两位研发者秉持的理念:技术应该融入生活,让咱们能更好地欣赏平常,而不是挤压人类的存活空间。
联合创始人 Kelin Carolyn Zhan 坦言道诗歌相机的道理所在「对我来讲,这仍然是艺术,它是关于表达的。诗歌相机是一台塑造咱们想要看到的世界的工具,这亦是一个人们能够把玩新技术的世界:人工智能并不全是厄运和悲观,亦不仅是用更深、更快、更糟糕的方式模仿人类,而是用新技术创造全新的工具,再让工具再次带出人类内心的孩儿。针对这个项目来讲,这不是为了挣钱——而是为了让哪些天真的奇迹再次作为可能。」
但在创意之外,咱们又不得不产生疑惑:GPT-4 生成的诗已然模有样,那在诗的创作上,超越人类是不是只是时间问题?
人工智能写的诗,能和人比吗?
当咱们站在赏鉴的方向再看诗歌相机的成诗,能够感受到人工智能和诗人作诗上的差异所在,人工智能写的诗有更显著地「描述」和「次序」,用词上更连贯,例如「日光透过褪色的薄纱」「天花板的影子之舞,」,更像是用文雅的词描述一个场景,其中缺少了诗歌难以描述的抽象感和意象美。
就像诗刊社在《GPT 时代,诗歌的道理和价值所在?》里说到的,「GPT 的显现是对文本次序的改变,它省略了世界与作者的概念,中间加入的是标准化、数字算法,却没法模仿诗歌的意象。」
诗人夏宇所写的现代诗|图源:夏宇
诗人欧阳江河亦曾在采访里说到「写作背面的广阔性是人的生命、人的世界观。这些包含了生命的感动、生命的升华、生命的伤痛、生命的恐惧、生命的阴暗、生命的爱、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聪明了,它无病痛,无生命的脆弱感和恐惧,而诗歌正是这些的产物。倘若无这般的源自,只剩下美丽的句子是无道理的。」
诗不像围棋或公式,诗无确定的答案,当咱们质疑人工智能写诗的能力,咱们更大都是在质疑它诗的由来。
就像在 1982 年的科幻电影《银翼杀手》里,人造人罗伊·巴蒂在死前留下了全片最富有诗歌气息的台词,这寓意着人类,最少《银翼杀手》的创作团队相信,在一起经历了对生命的感受之后,人工智能体亦能创作出优美且富有人性的诗歌。
罗伊·巴蒂死前独白|图源:银翼杀手
回到诗歌相机上,在咱们认识这个设备后,并无感受到一种「被人工智能挑战」的紧迫感,反而是新奇更甚,毕竟当咱们触手可及的设备能进行一种艺术的表达时,它亦随之解锁了咱们看待周遭的一种独特的方式。
就像诗人夏宇在 2023 年与 ChatGPT 合作完成为了一册诗集《验证您是人类》,她和 ChatGPT 探讨诗、评论、语言、设备、笑话……最后她在采访里说道「人类至上的人类又在搞设备人,处处代入人的语法人的意图动机人的情感……与 ChatGPT 的沟通,透过它习得的人类语言,它亦学得火速,我还是期盼它保存它的机械性不要轻易进入人性。」
与其去较真人工智能和人类在写诗上还有多少差距,乃至产生精神危险感。咱们更应该关注,用算法和数据喂饱的人工智能是怎么样观察被咱们忽略的周遭,它又能否激发出人类的诗性。
头图源自:Poetry Camera
|