一文讲透ai作画原理技术 - AI绘画每日一帖

j8typz · 发表于 2024-7-3 17:59:43

在上一篇文案 ai绘画是什么意思？什么是ai绘画？中，咱们讲到近期火热的 AI 作画技术是是经过文本描述生成绘画，今天咱们就讲一下这暗地里的ai绘画技术和ai画画原理。

“大象在天上飞”～当 AI 起始想象

早在 1980s，人工智能的先行者们就在尝试处理 AI 识别物体的问题，最后在 2015 年 AI 的识别能力超越了人类水平。

能识别照片中的物体后，火速 AI 成功地将这些标签组合成一句话，这便是图像字幕技术（image captioning）：经过图像生成对应的一句话描述。

这个过程能不可反过来？换言之，能不可经过照片生成描述照片的一句话呢？

相比从照片生成字幕，这是相当大的挑战，科研者期盼 AI 能生成人们前所未见的照片。2016 年，这一设想作为了现实，便是这些 32 * 32 像素的照片。

这为咱们展示了有些将来的可能性，而此刻，将来已来！

说到 AI 作画，非常多批评者会说到 “缝合怪” “抄袭”。咱们可能会假设，当咱们输入 “一只骑摩托车的大熊猫”

AI 会在数据库里检索 “摩托车”、“大熊猫” 的照片，而后把她们拼在一块

但实质上并非如此，要认识 AI 怎么生成照片，必须先理解 latent space——潜在空间。大众都有自己的身份证号码，前 6 位表率地区、中间 8 位表率生日、后 4 位表率个人其他信息。放到空间上如图所示，这个空间便是「人类潜在空间」。

这个空间上相近的人，可能便是生日、地区接近的人。人能够对应为这个空间的一个点，这个空间的一个点亦对应一个人。倘若在空间中我的周边找一个点，对应的人可能跟我非常类似，没准便是我失散数年的兄弟 hh

AI 便是经过学习找到了一个「照片潜在空间」，每张照片都能够对应到其中一个点，相近的两个点可能便是内容、风格类似的照片。

因此这个空间中有一个区域是 “大熊猫区”，一个区域是 “摩托车区”。提示语 “一只骑摩托车的大熊猫” 会帮忙 AI 找到「照片潜在空间」中某个可能位置于 “大熊猫区”、“摩托车区” 交汇处的点。AI 再把这个点经过某种方式「生成」一张照片，这种方式便是大名鼎鼎的 “Diffusion”。

至于 AI 是怎么经过 prompt（提示语）找到「照片潜在空间」中对应的点，再把这个点生成一张照片，敬请关注ai绘画是怎么画的？ai绘画算法揭秘照片引用：

【原创】

作者：倒立的BOB

更加多精彩内容请拜访～

1fy07h · 发表于 2024-10-22 21:23:38

我完全同意你的观点，说得太对了。

1fy07h · 发表于 2024-10-31 02:33:18

回顾过去一年，是艰难的一年；展望未来，是辉煌的一年。

m5k1umn · 发表于昨天 17:07

一看到楼主的气势，我就觉得楼主同在社区里灌水。

		自动登录	找回密码
密码			立即注册