作者:yichaozhou,腾讯 PCG 应用科研员
AI 画画这个行业发展太快了,要晓得去年的 AI 画画还是这个画风的:
此刻的 AI 画画已然快速进化到这个程度:
施法咒语长这般——
film still, [film grain], large crowds, cyberpunk street, street level photograph, Chinese neon signs, time square advertisements, Dark atmospheric city by Jeremy Mann, Nathan Neven, James Gilleard, James Gurney, Makoto Shinkai, Antoine Blanchard, Carl Gustav Carus, Gregory Crewdson, Victor Enrich, Ian McQue, Canaletto, oil painting, brush hard, high quality, (brush stroke), matte painting, (very highly detailed)
生成结果长这般——
关于近期各个模型的惊人结果此刻应该已然有非常多文案介绍了,本文主想要尽可能直白地解释 AI 画画的原理。由于这块亦是近期才起始触及,有些地区倘若没理解对,欢迎指正和交流。
1、计算机怎样生成图画
让咱们言归正传,AI 是怎么学会画图的呢?
这就要触及到两个方面了。一个是能生成出像真实照片同样的数据,一个是要听得懂咱们想要它生成什么,并给出对应的结果。
首要来讲说看怎样生成出像真实照片同样的数据。这触及到设备学习中的一个要紧分支——生成模型(generative model)。针对生成图像这个任务来讲,一般一个生成模型必须先吞进海量的训练数据(巨量的人类真实照片),而后再学习这些数据的分布,去模仿着生成同样的结果。设备学习的核心没非便是这么回事,难点终究是在怎样设计模型让模型能更好学到这般的分布上。
要讲生成模型,有一个不得不提的技术便是 VAE,变分自编码器,即 variational auto-encoder。这其中的 auto-encoder,虽然叫 auto-encoder 然则其实包括了编码器 encoder 和解码器 decoder,是一个对叫作的网络结构。针对一系列类似的数据,例如照片,虽然数据量很大然则其实是符合必定分布规律的,信息量远少于数据量。编码器的目的便是把数据量为 n 维的数据压缩成更小的 k 维特征。这 k 维特征尽可能包括了原始数据里的所有信息,只必须用对应的解码器,就能够转换回原来的数据。在训练的过程中,数据经过编码器压缩再经过解码器解压,而后最小化重建后数据和原始数据的差
|