ChatGPT用上AI绘画：自己写词自己画，10月就能玩

j8typz · 发表于 2024-8-19 02:48:26

在国内AI大模型已将“文生图”功能搞得如火如荼的时候，ChatGPT最终“姗姗来迟”地用上了AI绘画功能。

北京时间9月21日清晨，OpenAI官方发布一条视频，配以“DALL·E 3（握手）ChatGPT”的文字，正式宣告了旗下两大AI大模型的结合。

官网还给出了详细上线时间：会员版（20美元/月）和企业版10月可用，面向研发实验室的API接口则在今年秋天晚些时候供给。

大语言模型竞赛最初引爆点的ChatGPT自不必多说，另一款DALL·E模型则面向图像生成行业，在2021年1月5日推出，是最早的一批AI图像生成大模型，亦叫作得上是AI绘画行业的开启者和引领者。

而此刻，两个各自行业的引领者的合并，或许又将诱发新一轮的风暴。

···

OpenAI官方宣布，新的结合体即DALL·E模型第三代——DALL·E 3。

它再也不必须以往AI绘画的繁杂到自成体系（乃至必须专门学习）的提示词，亦再也不仅有文字之间的聊天。用户只必须用最自然浅显的文字描述自己想象中的场景，善于阅读理解的ChatGPT和专长画画的DALL·E，就能直接一步到位生成图像。

就像是官网放出的例子，给出的描述（从左往右，从上至下）是：

人行道上的行人们熙熙攘攘，正在享受她们的夜生活。

满月照耀着繁华的都市街道。

在街角的小摊上，一位满头红发、身着标志性天鹅绒斗篷的青年女子正与脾气暴躁的老摊主讨价还价。

脾气暴躁的老摊主身材高挑、成熟，穿着笔挺的西装，留着引人注目的小胡子，正在用他的蒸汽朋克式tel兴致勃勃地交流。

能够看到，最后生成的图像不仅一一还原出了“满头红发”“天鹅绒斗篷”“蒸汽朋克式tel”这些关键词，连“享受夜生活”“脾气暴躁”“兴致勃勃”等较为模糊、主观色彩较浓的描述，亦给出了自己的理解。

而对比尚未结合ChatGPT的第二代DALL·E模型，面对相同的描述——“一幅富有表现力的篮球运动员扣篮油画”，DALL·E 2将“星云爆炸”的意象与扣篮动作拼在了一块，而DALL·E 3则直接将“星云爆炸”意象与扣篮运动员进行了融合。

左为DALL·E 2，右为DALL·E 3

从官网放出的示例照片和视频来看，DALL·E 3的最大优良在于整合了ChatGPT强大的自然语言处理能力，不仅在语言理解上大幅飞跃，还能自己写设备易于理解的提示词，再将其“转达”给图像生成的模块，最后就能生成细节和还原想象程度都再次飞跃的图像。

···

除了以上核心功能，AI图像标注、隐私安全、训练数据源自等始终备受关注的问题亦均在这次新制品中有所触及。

OpenAI暗示，她们正在研发一种图像源自“鉴别器”，以帮忙人们识别某一图像是不是是由于DALL·E 3生成的AI产物。这一工具会嵌套在DALL·E 3内部，在将来一块推出。

在隐私安全上，OpenAI提出已与红队专家（对模型进行压力测试的行业专家）合作，防止DALL·E 3生成暴力、色情或其他有害照片，在针对公众名人关联的照片和信息亦会加强危害评定能力。

还有当前非常多创造者所诟病的“我的绘画未经同意便被爬取做为训练数据”的状况，OpenAI暗示，艺术家能够填写表格，禁止她们的网络爬虫GPTBot拜访自己的个人网站，还能够直接向官方发送邮件指明自己的隐私图像，这般，官方亦会将其从训练数据中删掉。

采写：南都记者杨博雯

nykek5i · 发表于 2024-10-4 01:10:14

真情实感，其含义为认真了、走心了的意思，是如今的饭圈常用语。

m5k1umn · 发表于 2024-10-13 13:32:41

期待你更多的精彩评论，一起交流学习。

		自动登录	找回密码
密码			立即注册