近期几年,人工智能经历了爆火、发展、再到近期的热度逐步下降,似乎人工智能已然成为了大厂才可玩的游戏。
究其原由,便是人工智能的「门槛」越来越高了。
前不久,谷歌AI的表率名人Jeff Dean发布了一个新的工作,但在行业内却诱发了一阵不小的风波。究其原由,并不是工作本身有多么出色。这个科研只比最新结果提高了0.03%,但却花费了价值57000多美元的TPU算力,这一下就炸锅了。
非常多人说,此刻的AI科研已然变成为了拼算力、拼资源的表率,普通学者卷不动了。
还有非常多人有这般的疑惑:人工智能到底给咱们带来了那些改变?它除了下围棋之外还会做什么,它的将来还会怎样发展?
带着这些问题,咱们和冯霁博士进行了深入沟通。他是创新工场南京AI科研院的执行院长、倍漾量化创始人,在AI行业有着数年的科研经验。经过这次对谈,让咱们对AI将来的发展和落地有了新的认识。
下面的小视频提炼了对话的亮点,文案是针对对话的整理和采编,以飨读者,期盼大众亦能从中获益。
注:以下的“我”,指的都是冯霁博士。
1 人工智能创新,遇到天花板?
谷歌近期这个问题的确受到了挺多关注,我觉得有三个问题值得思考:
第1,大厂起始逐步地走向「暴力美学」,亦便是用「超大规模的数据」+「超大规模的算力」,暴力探索深度神经网络的天花板。不外,这种办法的边界和极限在哪?
第二,从学术和研究的方向,这种办法是不是是AI独一的出路?事实上,日前已然有海量科研在探索其他的技术路线,例如怎么样做到从感知智能往认知智能去做转变、怎么样利用比较小的数据量处理人工智能遇到的问题,等等。
第三,针对工业界的实质应用,是不是真的必须如此大的算力?工业界有海量任务是非语音图像文本关联的,这亦是在倒逼着学术界去做有些比较有效的算法。
2 人工智能算法,仅有深度神经网络?
90年代之前,「人工智能」的表率技术还是以「符号主义」为主,亦便是基于规律推理,去做Planning、Searching这般的技术。
2010年之后,迎来了人工智能的一次要紧的转变,那便是用神经网络技术去更好地暗示这些感知类的任务。然则,日前还有海量的人工智能的「圣杯」问题无得到处理,例如怎么样做规律推理、怎么样做常识、怎么样更好地对记忆进行建模等等。
为认识决这些问题,是不是用深度神经网络就够?这可能是日前学术界和工业界更关心的下一个要紧的方向。
3 人工智能的将来:感知 vs 认知?
所说的「感知人工智能」,其实便是近期几年人工智能成功落地的表率性例子,例如图像识别、语音转文字,以及有些文本生成的任务等。
但更要紧的是,怎么从这种感知类的任务,转向拥有认知能力的任务,尤其是怎么用人工智能的方式来实现规律推理、实现常识,从而真正实现通用人工智能?
针对这个问题,据我所知,学术界重点有三条技术路线。
第1,仍然沿着神经网络这条路,经过持续地堆数据和算力尝试处理问题。
第二,尝试导入符号主义的技术,亦便是连接主义+符号主义的结合。
第三,继续提高传统的规律推理技术,而这条路线亦是最难的。
4 数据:数字时代的石油怎么采?
数据针对人工智能工程来讲,要紧性已然越来越高了。工业界提出了一个新的概念,叫「以数据为中心」的研发模式。相比之下,之前叫做「以模型为中心」。
传统状况下,工程师更加多的时间会花在怎样搭建一个模型、怎样经过调参来让这个系统的性能更好。但现如今,大众80%的重视力都放在怎样让数据集变得更好、怎样让训练集变得更好、怎样让训练集更平衡,而后让这个模型在好的数据集上训练,并得到比较好的结果。
随着咱们对数据隐私需求的逐步增长,数据带来的有些负功效以及非技术需求亦越来越多了。例如当几家公司做联合建模的时候,出于对数据隐私的保护,数据不可够在公司之间分享。因此像联邦学习这般的技术,便是为了在守护数据隐私的前提下,实现联合建模。
此刻大众已然逐步地认识到,在详细的工业研发中每家公司不同样的地区便是她们的数据。此刻有了非常便利的软件开源框架,亦有了非常有效的硬件实现,工程师就都转而去关注数据了——这是一个Paradi
|