在上一篇文案 ai绘画是什么意思?什么是ai绘画? 中,咱们讲到近期火热的 AI 作画技术是是经过文本描述生成绘画,今天咱们就讲一下这暗地里的ai绘画技术和ai画画原理。
“大象在天上飞”~ 当 AI 起始想象
早在 1980s,人工智能的先行者们就在尝试处理 AI 识别物体的问题,最后在 2015 年 AI 的识别能力超越了人类水平。
能识别照片中的物体后,火速 AI 成功地将这些标签组合成一句话,这便是图像字幕技术(image captioning):经过图像生成对应的一句话描述。
这个过程能不可反过来?换言之,能不可经过照片生成描述照片的一句话呢?
相比从照片生成字幕,这是相当大的挑战,科研者期盼 AI 能生成人们前所未见的照片。2016 年,这一设想作为了现实,便是这些 32 * 32 像素的照片。
这为咱们展示了有些将来的可能性,而此刻,将来已来!
AI = 缝合怪?
说到 AI 作画,非常多批评者会说到 “缝合怪” “抄袭”。咱们可能会假设,当咱们输入 “一只骑摩托车的大熊猫”
AI 会在数据库里检索 “摩托车”、“大熊猫” 的照片,而后把她们拼在一块
但实质上并非如此,要认识 AI 怎么生成照片,必须先理解 latent space——潜在空间。大众都有自己的身份证号码,前 6 位表率地区、中间 8 位表率生日、后 4 位表率个人其他信息。放到空间上如图所示,这个空间便是「人类潜在空间」。
这个空间上相近的人,可能便是生日、地区接近的人。人能够对应为这个空间的一个点,这个空间的一个点亦对应一个人。倘若在空间中我的周边找一个点,对应的人可能跟我非常类似,没准便是我失散数年的兄弟 hh
AI 便是经过学习找到了一个「照片潜在空间」,每张照片都能够对应到其中一个点,相近的两个点可能便是内容、风格类似的照片。
因此这个空间中有一个区域是 “大熊猫区”,一个区域是 “摩托车区”。提示语 “一只骑摩托车的大熊猫” 会帮忙 AI 找到「照片潜在空间」中某个可能位置于 “大熊猫区”、“摩托车区” 交汇处的点。AI 再把这个点经过某种方式「生成」一张照片,这种方式便是大名鼎鼎的 “Diffusion”。
至于 AI 是怎么经过 prompt(提示语)找到「照片潜在空间」中对应的点,再把这个点生成一张照片,敬请关注ai绘画是怎么画的?ai绘画算法揭秘照片引用: “大象在天上飞”~ 当 AI 起始想象https://github.com/floydhub/image-classification-templatehttps://towardsdatascience.com/image-captioning-in-deep-learning-9cd23fb4d8d2https://arxiv.org/pdf/1511.02793.pdfhttps://www.youtube.com/watch?v=SVcsDDABEkM AI = 缝合怪?画宇宙 - 人工智能 AI 作画网站https://joeschmoe.io/api/v1/randomhttps://medium.com/mlearning-ai/latent-space-representation-a-hands-on-tutorial-on-autoencoders-in-tensorflow-57735a1c0f3fhttps://unsplash.com/
【原创】
作者:倒立的BOB 原文请参考:一文讲透ai作画原理技术
更加多精彩内容请拜访 ~ 画宇宙 - 人工智能 AI 作画网站
|