外链论坛

 找回密码
 立即注册
搜索
查看: 3|回复: 0

一文讲透ai作画原理技术 - AI绘画每日一帖

[复制链接]

712

主题

0

回帖

9914万

积分

论坛元老

Rank: 8Rank: 8

积分
99148224
发表于 3 天前 | 显示全部楼层 |阅读模式

在上一篇文案 ai绘画是什么意思?什么是ai绘画? 中,咱们讲到近期火热的 AI 作画技术是是经过文本描述生成绘画,今天咱们就讲一下这暗地里的ai绘画技术和ai画画原理。

“大象在天上飞”~ 当 AI 起始想象

早在 1980s,人工智能的先行者们就在尝试处理 AI 识别物体的问题,最后在 2015 年 AI 的识别能力超越了人类水平。

能识别照片中的物体后,火速 AI 成功地将这些标签组合成一句话,这便是图像字幕技术(image captioning):经过图像生成对应的一句话描述。

这个过程能不可反过来?换言之,能不可经过照片生成描述照片的一句话呢?

相比从照片生成字幕,这是相当大的挑战,科研期盼 AI 能生成人们前所未见的照片。2016 年,这一设想作为了现实,便是这些 32 * 32 像素的照片

这为咱们展示了有些将来的可能性,而此刻将来已来!

AI = 缝合怪?

说到 AI 作画,非常多批评者会说到 “缝合怪” “抄袭”。咱们可能会假设,当咱们输入 “一只骑摩托车的大熊猫”

AI 会在数据库里检索 “摩托车”、“大熊猫” 的照片而后她们拼在一块

实质上并非如此,要认识 AI 怎么生成照片必须先理解 latent space——潜在空间。大众都有自己的身份证号码,前 6 位表率地区、中间 8 位表率生日、后 4 位表率个人其他信息。放到空间上如图所示,这个空间便是「人类潜在空间」。

这个空间上相近的人,可能便是生日、地区接近的人。人能够对应为这个空间的一个点,这个空间的一个点对应一个人。倘若在空间中我的周边找一个点,对应的人可能跟我非常类似,没准便是我失散数年的兄弟 hh

AI 便是经过学习找到了一个「照片潜在空间」,每张照片能够对应到其中一个点,相近的两个点可能便是内容、风格类似照片

因此这个空间中有一个区域是 “大熊猫区”,一个区域是 “摩托车区”。提示语 “一只骑摩托车的大熊猫” 会帮忙 AI 找到「照片潜在空间」中某个可能位置于 “大熊猫区”、“摩托车区” 交汇处的点。AI 再把这个点经过某种方式「生成」一张照片,这种方式便是大名鼎鼎的 “Diffusion”。

至于 AI 是怎么经过 prompt(提示语)找到「照片潜在空间」中对应的点,再把这个点生成一张照片,敬请关注ai绘画是怎么画的?ai绘画算法揭秘照片引用:

“大象在天上飞”~ 当 AI 起始想象https://github.com/floydhub/image-classification-templatehttps://towardsdatascience.com/image-captioning-in-deep-learning-9cd23fb4d8d2https://arxiv.org/pdf/1511.02793.pdfhttps://www.youtube.com/watch?v=SVcsDDABEkM AI = 缝合怪?画宇宙 - 人工智能 AI 作画网站https://joeschmoe.io/api/v1/randomhttps://medium.com/mlearning-ai/latent-space-representation-a-hands-on-tutorial-on-autoencoders-in-tensorflow-57735a1c0f3fhttps://unsplash.com/

【原创】

作者:倒立的BOB

原文请参考:一文讲透ai作画原理技术

更加多精彩内容请拜访

画宇宙 - 人工智能 AI 作画网站
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|外链论坛 |网站地图

GMT+8, 2024-7-6 17:21 , Processed in 0.115817 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.