原标题:OpenAI能作词,咱们输入吴也凡的“大碗宽面”试了一把
源自 | 澎湃资讯
见习记者 | 张唯
几十年来,设备始终在奋斗学习人类语言的微妙之处,深度学习的显现加速了这一进程。
今年2月,OpenAI发布了一款令人印象深刻的语言模型GPT-2,它能够写短篇小说、诗歌,乃至容易辨别《哈利波特》和《指环王》中的角色。近期,一位加拿大工程师用它创建了一个向公众开放的文本生成器,只需供给一个句子,设备便能自动生成一则完整的资讯、故事、歌词、诗歌、食谱和代码等文本。
咱们用吴也凡在综艺节目《七十二层奇楼》中的一段freestyle(即兴说唱)——“你看这个面它又长又宽,就像这个碗它又大又圆”进行了创作。一起来瞧瞧人工智能的freestyle水平吧。
芒果TV综艺《七十二层奇楼》
人工智能版《大碗宽面》
这个名为talktotransformer的文本生成器由加拿大工程师亚当·金(Adam King)创建,它脱胎于OpenAI的大规模无监督语言模型GPT-2。talktotransformer运用的是GPT-2的精简版本,这个版本过去只开放给特定的专家和记者。
在talktotransformer中输入文本“你看这个面它又长又宽,就像这个碗它又大又圆”后,人工智能创作出的歌词大意为:
你看这个面它又长又宽,
就像这个碗它又大又圆。
只需尝一口,你就晓得是面条。
我的脸上,露出可疑的表情。
这是真的,我的碗它变成了面条。
这简直太棒了。
当我回到家,我得到有些鸡翅。
我怎么会变得这么好?谁晓得呢?
我从伴侣和家人那里得到足够的爱,
我的味蕾起始变大。
当我要吃饭的时候,
它再也不只是食品,它是我的想法。
我想要吃好喝好的生活。
talktotransformer模型的输出结果
经过阅读以上由人工智能模型输出的文字,咱们很容易发掘,设备输出了有些看似语义完整的句子,但其中的意思却让人摸不着头脑。这便是自然语言处理(NLP)的困难——因为缺乏常识,设备并不真正理解语言的含义。
就如2018年图灵奖得到者约书亚·本吉奥(Yoshua Bengio)在接受澎湃资讯(www.thepaper.cn)采访时所言,日前的自然语言系统其实并不睬解句子的真正含义,设备“会犯有些非常愚蠢的错误,乃至无两岁小孩的理解能力”。
talktotransformer.com页面
文思泉涌的OpenAI GPT-2语言模型
2019年2月,OpenAI发布了持有15亿参数的大规模无监督语言模型GPT-2,它善于处理语言建模和文本预测任务,还具备阅读理解、总结、翻译等能力。只要给出一个开头的句子,GPT-2就能生成一篇小文案、一则资讯故事,乃至在文本中运用引语和统计数据。倘若给出的句子是一个短篇小说的开头,它会告诉你接下来在这些角色身上会出现什么事。
OpenAI加利福尼亚州实验室工程副总裁David Luan对美国科技媒介《边缘》(THE VERGE)暗示,GPT-2能写出“非常恰当的”、“叫作职的”论文,“是能够提交给美国大学入学资格考试(SAT)并取得好成绩的东西”。
GPT-2在人工智能社区导致了不小的关注,但OpenAI当时并无开源这个系统。一方面,科研人员对该算法能做什么、不可做什么尚不知道;另一方面,她们担心这项技术被乱用——开源之后,倘若有人向GPT-2供给种族主义、暴力、卑视女性或辱骂性的文本,GPT-2将自动学习并连续地输入类似的内容。
不开源的决定诱发了人工智能社区的不满,毕竟,开源是人工智能行业的优良传统。亦许是反对的声音太大,OpenAI在5月初暗示将逐步公开GPT-2,并开源了345M的预训练模型。后续,OpenAI将分析该语言模型对社会的影响。
|