文 | 尚恩
编辑 | 邓咏仪
OpenAI悄咪咪的又在半夜整活,这次直接把AI绘画和ChatGPT合并了!
源自:OpenAI
美国时间9月21日凌晨,OpenAI官宣文生图AI工具DALL·E系列迎来最新版本DALL·E 3。相比上一代模型DALL·E 2,DALL·E 3自己的画技不仅提高巨大,还能准确理解语意、细节的细微描述差异。
还记得去年DALL·E 2发布时,带动了一波AI文生图模型热,包含Stable Diffusion在内的众多与AI生图相关的工具、模型都是在当时推出的。
更重要的是,这次OpenAI直接把DALL·E 3和ChatGPT集成到了一块。
源自:OpenAI
简单说便是,新版DALL·E 3,直接省去了提示词工程(Prompt Engineering)这一步,你只管随意发挥想象,词由ChatGPT帮你拓展,画画就交给AI来搞,So Easy。
源自:公开网络
对此,OpenAI联合创始人Greg Brockman直接暗示:
很难不爱。
源自:X(原Twitter)
这般操作,亦属实是把网友看的一愣一愣的。不少网友都惊呼,这亦太绝了!
源自:X(原Twitter)
亦有网友在看过DALL·E 3生成的图后,直接暗示:“Midjourney拜拜了您内”。
源自:X(原Twitter)
在ChatGPT里就能玩
要说这次DALL·E 3发布中,最大的亮点,当属是把AI绘图原生构建在ChatGPT之上。
为啥这么说?对比以前的文生图工具,都是先将文本Prompt转换成图像,即使是 DALL·E 2,亦会经常忽略特定的措辞引起出错。此刻只需向ChatGPT提出需求,一个简单的句子,AI就能开启头脑风暴改进提示,再亦不消为写不出华丽的提示词而头疼
乃至,你还能够在对话过程中,基于生成的图像随时做出修改。
例如官方给出的这个例子,仔细的展示了DALL·E 3是怎样详尽地将提示词中的每一个场景,生成如下一幅佳作。
一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。
源自:OpenAI
除此以外,OpenAI亦暗示:“DALL·E 3比以往系统更能理解细微差别和细节,让用户更加容易地将自己的想法转化为非常准确的图像。”
例如,下面这两幅图分别是由于DALL·E 3与DALL·E 2生成,一样的一段Prompt「一幅描绘篮球运动员扣篮的油画,并伴以爆炸的星云」,左图 DALL·E 2在细节、清晰度、明亮度等方面显然逊于右图DALL·E 3的。
左:DALL·E 2;右:DALL·E 3
源自:OpenAI
DALL·E 3+ChatGPT配置到底有多绝?这不,OpenAI官方就专门给DALL·E 3搞了一个超可爱的宣传视频,连CEO Sam Altman都忍不住叫作赞。
源自:X(原Twitter)
按照放出的视频,能够看到用户写了一段提示词「我家5岁宝宝始终在说一个超级向日葵刺猬,它该长什么样?」,ChatGPT同期写了四段区别风格的提示词,直接生成四张风格迥异的图。
源自:OpenAI
接下来选取最后一张图,给小刺猬起个名字,就叫小Larry吧,并为它画一个房子。
源自:OpenAI
另一,DALL·E 3还能够按照照片的风格,生成可爱的贴纸。
源自:OpenAI
最后,让ChatGPT总结一下刚才的内容,生成一个睡前故事。咱便是好家伙,这协同着ChatGPT配件玩,完全能够生成一个电子书了。
源自:OpenAI
日前DALL·E 3还未完全开放,想玩还得等一等,不外能够先来瞧瞧OpenAI放出的海量样图,官方亦很贴心的给每张图都附上了对应的提示词。
提示词:一个装饰着室内植物的咖啡馆的小地图立体模型,顶部是木质横梁纵横交错,里面有一个冷饮站,上面有小瓶子和玻璃杯。
源自:OpenAI
提示词:一种带有大玻璃窗的现代建筑物,坐落在悬崖上,在日落时能够俯瞰清闲的海洋。
源自:OpenAI
而CEO Altman最爱好的则是这张“牛油果看大夫”。
源自:X(原Twitter)
有网友去试把一样的提示词用在DALL·E 2上的效果,嗯….咱便是说,咋看咋别扭。
源自:X(原Twitter)
这么一对比,能够发掘DALL·E 3确实进步了不少。
下面简单梳理了一下DALL系列。
DALL·E诱发AI绘图热,Midjourney捏把汗
2021年1月6日,OpenAI在其博客发布了两个文本图像的神经网络**DALL·E和CLIP。DALL·E能够基于文本直接生成图像,CLIP则能够完成图像与文本类别的匹配。
2022年4月,DALL·E 迎来升级版本-DALL·E 2。与一代相比,DALL·E 2在生成用户描述的图像时拥有更高的分辨率和更低的延迟。并且,二代还增添了有些新的功能,例如对原始图像进行编辑。
源自:OpenAI
日前,DALL·E 3处在科研预览版本,按照OpenAI计划,将于10月份首要向ChatGPT Plus和ChatGPT Enterprise用户发布,独立版在今年秋天晚些时候供给。
随着OpenAI推出DALL·E 3,AI绘画行业只能说是太卷了,其中最大的玩家莫过于估值10亿美元的文生图“扛把子”Midjourney了。
非常多网友们亦手痒搞事,用同一个提示词在DALL·E 3和Midjourney生成,而后放出来进行比较。
源自:X(原Twitter)
源自:OpenAI、Midjourney
对比看下来,你觉得哪个效果更好呢?
One More Thing
AI生图虽然好玩,但争议亦不少,今年初Stability AI和Midjourney就遭到三位艺术家的版权诉讼。
这一次,在版权问题、生图安全这块,OpenAI亦是专门下了点功夫。
源自:Artist and Creative Content Owner Opt Out
首要,OpenAI在DALL·E 3上进行了海量工作,包含强化安全办法,以防止生成暴力、色情的图像,或是带有公众名人姓名的图。
另一,为了保证模型的安全性,团队还运用了输入归类器,能够帮忙识别图像是不是由DALL·E 3生成
另外,OpenAI还准许创作者填写表格,禁止网络爬虫拜访艺术家自己的网站。亦能够直接发送想要守护隐私的图像,团队就会将其从训练数据中删掉。
长按添加「智涌」小助手入群
|