一文讲透ai作画原理技术 - AI绘画每日一帖-外链论坛

j8typz 发表于 2024-7-3 17:59:43

一文讲透ai作画原理技术 - AI绘画每日一帖

在上一篇文案 <a style="color: black;">ai绘画是什么意思？什么是ai绘画？</a> 中，咱们讲到近期火热的 AI 作画技术是是经过文本描述生成绘画，今天咱们就讲一下这暗地里的ai绘画技术和ai画画原理。
<h2 style="color: black; text-align: left; margin-bottom: 10px;">“大象在天上飞”～当 AI 起始想象</h2>
早在 1980s，人工智能的先行者们就在尝试处理 AI 识别物体的问题，最后在 2015 年 AI 的识别能力超越了人类水平。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic4.zhimg.com/80/v2-f88ab46294290ead6ae26d0497b4bab3_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
能识别照片中的物体后，火速 AI 成功地将这些标签组合成一句话，这便是图像字幕技术（image captioning）：经过图像生成对应的一句话描述。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic4.zhimg.com/80/v2-657ce25d83f6e1baf5b58f043e998023_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
这个过程能不可反过来？换言之，能不可经过照片生成描述照片的一句话呢？
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic2.zhimg.com/80/v2-4f0b93abbf666153c8a4892dc026e775_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
相比从照片生成字幕，这是相当大的挑战，科研者期盼 AI 能生成人们前所未见的照片。2016 年，这一设想作为了现实，便是这些 32 * 32 像素的照片。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-dcd6549aa226eaafd85dda8895bacef8_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
这为咱们展示了有些将来的可能性，而此刻，将来已来！
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-408ed98883fa3d02dd1dbf4e6c41cc2c_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
<h2 style="color: black; text-align: left; margin-bottom: 10px;">AI = 缝合怪？</h2>
说到 AI 作画，非常多批评者会说到 “缝合怪” “抄袭”。咱们可能会假设，当咱们输入 “一只骑摩托车的大熊猫”
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-82a5e6f641099553b10745a81339b16c_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
AI 会在数据库里检索 “摩托车”、“大熊猫” 的照片，而后把她们拼在一块
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-7d7da95f3a9e7d9e33e142690137fe0a_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
但实质上并非如此，要认识 AI 怎么生成照片，必须先理解 latent space——潜在空间。大众都有自己的身份证号码，前 6 位表率地区、中间 8 位表率生日、后 4 位表率个人其他信息。放到空间上如图所示，这个空间便是「人类潜在空间」。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-9686b7533a90ae0505f43d4738b4513a_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
这个空间上相近的人，可能便是生日、地区接近的人。人能够对应为这个空间的一个点，这个空间的一个点亦对应一个人。倘若在空间中我的周边找一个点，对应的人可能跟我非常类似，没准便是我失散数年的兄弟 hh
AI 便是经过学习找到了一个「照片潜在空间」，每张照片都能够对应到其中一个点，相近的两个点可能便是内容、风格类似的照片。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-558d388bf418ff0ed679f26091acbcf6_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
因此这个空间中有一个区域是 “大熊猫区”，一个区域是 “摩托车区”。提示语 “一只骑摩托车的大熊猫” 会帮忙 AI 找到「照片潜在空间」中某个可能位置于 “大熊猫区”、“摩托车区” 交汇处的点。AI 再把这个点经过某种方式「生成」一张照片，这种方式便是大名鼎鼎的 “Diffusion”。
<div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic1.zhimg.com/80/v2-dc8de629432f0df0f5f97f90f465d8dc_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
至于 AI 是怎么经过 prompt（提示语）找到「照片潜在空间」中对应的点，再把这个点生成一张照片，敬请关注<a style="color: black;">ai绘画是怎么画的？ai绘画算法揭秘</a>照片引用：“大象在天上飞”～当 AI 起始想象<a style="color: black;">https://github.com/floydhub/image-classification-templat</a>e<a style="color: black;">https://towardsdatascience.com/image-captioning-in-deep-learning-9cd23fb4d8d2</a><a style="color: black;">https://arxiv.org/pdf/1511.02793.pdf</a><a style="color: black;">https://www.youtube.com/watch?v=SVcs</a>DDABEkM AI = 缝合怪？<a style="color: black;">画宇宙 - 人工智能 AI 作画网站</a><a style="color: black;">https://joeschmoe.io/api/v1/random</a><a style="color: black;">https://medium.com/mlearning-ai/latent-space-representation-a-hands-on-tutorial-on</a>-autoencoders-in-tensorflow-57735a1c0f3f<a style="color: black;">https://unsplash.com/</a>
【原创】
作者：倒立的BOB原文请参考：<a style="color: black;">一文讲透ai作画原理技术</a>
更加多精彩内容请拜访 ～<a style="color: black;">画宇宙 - 人工智能 AI 作画网站</a>

1fy07h 发表于 2024-10-22 21:23:38

我完全同意你的观点，说得太对了。

1fy07h 发表于 2024-10-31 02:33:18

回顾过去一年，是艰难的一年；展望未来，是辉煌的一年。

m5k1umn 发表于前天 17:07

一看到楼主的气势，我就觉得楼主同在社区里灌水。

页: [1]

外链论坛's Archiver

一文讲透ai作画原理技术 - AI绘画每日一帖