@moonpie 这谁问的大逆不道的问题!开除中国籍!(暴言

我现在4g能上,wifi不行,挂梯ok
所以得换站点了吗……手机后台开梯真的很麻烦,舍不得活吧,但有种习以为常之感

@suebysue @mature 原来真的有老奶奶!这个所谓真的没有这张脸,你可以理解成,人群在每个维度的坐标轴都是一些具体的点,你如果要随机取到完全相同的点几乎是不可能的

很显然HR并不认同并且强烈要求明天给我打电话好好谈一谈!!!

Show thread

投稿之前:大家会不会都是做高大上的nature级别工作我们这种烂大街的小把戏会不会不够档次

投稿之后:怎么有且仅有两篇都是GAN!其他领域的朋友们呢快投稿!(push模式on

@AIfish 不是不是这个是我从之前公众号搬运的233我觉得长短没关系重要的是写清楚!

「Fairness in A.I.」想必即使是老奶奶也听闻过何为人工智能,那么今天就来说说有偏见的AI。

尽管多多少少在任何场景下都会存在不公平,但是在政治正确的大环境下人类的任务之一就是尽量的解决它,人工智能当然也要一样呀!

那么如果存在不公平的人工智能,会出现什么问题呢?

本月关于生成对抗网络(GAN)的一篇论文就提到:在本文中,我们表明,在数据沿某些轴(例如性别,种族)表现出偏见的情况下,GAN的故障模式会加剧所生成数据中的偏见。

所以说,首先是人来控制输入的训练数据,如果这个人本身就存在偏见的话,那么对应的人工智能就会成为有偏见的人2.0呢。

详情论文指路:arxiv.org/abs/2001.09528
#老奶奶都能懂的论文导读 @mature




@mature

Title:为什么神经网络可以创造未存在过的人脸

如果不告诉你,你能看出图一这张图片中的人是不存在的人吗?如果你看不出来,没关系,大部分人都看不出来,甚至有一个叫Kickstarter的公司利用这个技术行骗。他们在官网挂出的工程师团队照片,几乎都是由AI合成的虚拟人像,实际上是一个只有两个人的空壳公司,却骗过了所有人的眼睛。
这是一张由当下最先进的虚拟高清人脸合成网络styleGAN2【1】生成的不存在的人脸,每刷新一次就有一张新的【2】。styleGAN2使用了非常复杂的网络架构,但作为开山之作的GAN【3】本身其实蕴含的是一个很简单的博弈论思想。不过说到虚拟人脸生成,有一个不得不提的技术就是VAE,变分自编码器【4】。接下来就简单介绍一下虚拟图像生成领域的两大技术分支——VAE和GAN,以及为什么它们可以创造未存在过的人脸。

VAE,即variational auto-encoder。先讲auto-encoder,虽然叫auto-encoder但是其实包含了编码器encoder和解码器decoder,是一个对称的网络结构。对于一系列类似的数据,例如图片,虽然数据量很大但是其实是符合一定分布规律的,信息量远小于数据量。编码器的目的就是把数据量为n维的数据压缩成更小的k维特征。这k维特征尽可能包含了原始数据里的所有信息,只需要用对应的解码器,就可以转换回原来的数据。在训练的过程中,数据通过编码器压缩再通过解码器解压,然后最小化重建后数据和原始数据的差。训练好了以后,就只有编码器被用作特征提取的工具,用于进一步的例如图像分类等应用中,故称为autoencoder。其结构如图二所示。

垃圾是放错地方的资源,有一天解码器也被拿出来:你既然可以从k维特征向量恢复出一整张图片,那我给你一个随机生成的k维特征向量,看看你能生成什么。然而实际结果显示,autoencoder虽然可以“记住”见过的照片,但是生成新图像的能力很差。于是有了variational autoencoder。VAE在令k维特征中的每个值变成了符合高斯分布的概率值,于是对概率的改变可以让图片信息也有相应的平滑的改变,例如某个控制性别的维度,从0到1可以从一个男性的人脸开始,生成越来越女性化的人脸。

那么VAE其实还是有很多统计假设的,而且我们要判断它生成的效果如何,也需要评估它生成的数据和原始数据的差距大不大。于是有人丢掉所有统计假设,并且把这个评估真(原始数据)假(生成数据)差异的判别器也放进来一起训练,创造了GAN,生成对抗神经网络。GAN有两个部分,生成器和判别器。生成器从一些随机的k维向量出发,用上采样网络合成大很多的n维数据,判别器就负责判断合成出来的图片是真是假。一开始合成出来的都是意义不明的无规律结果,很简单的判别器就可以分辨出来。生成器发现一些生成的方向,比如有成块的色块,可以骗过判别器,它就会往这个方向合成更多的图片,而判别器发现被骗过去了,就会找到更复杂的特征来区分真假。如此反复,直到生成器生成的结果,判别器已经判断不出真假了,这就算是训练好了。这样训练出来的生成器,可以生成非常逼真,即使是人眼也很难分辨的图片,但是是不存在的。

对于生成器和判别器这样的相互对抗关系,李宏毅老师【5】有一个很恰当的比喻:生成器就是学生,而判别器是老师。但是这个老师的绘画是语文老师教的,他也不会画画。他只有一本课本(真实数据),所以他不能告诉学生应该怎么画,而是只告诉他你画的是对的还是错的。而学生又没有课本,所以只能靠老师给的反馈不断学习,直到学生画的图,老师已经不能和课本里的区分开了,学生就算是学会画画了。

Reference:
【1】styleGAN2:arxiv.org/abs/1912.04958

【2】务必试玩一下的styleGAN2生成器: thispersondoesnotexist.com/

【3】GAN:papers.nips.cc/paper/2014/file

【4】VAE: arxiv.org/abs/1312.6114

【5】youtube.com/watch?v=DQNNMiAP5l

Show older
alive.bar

你好,欢迎使用 alive.bar 社交媒体实例。 alive.bar 仅仅是一个服务器位于美国的网站,它使用了「长毛象(Mastodon)」服务。