视频加载失败,请刷新页面再试 刷新
1月13日,第十届新华网思客年会(山西)在临汾举行。世界工程组织联合会前主席、中国新一代人工智能发展战略科研院执行院长龚克在会上发布主旨演讲。龚克认为,先进生产力的发展是阻挡不了的,人工智能是一种新质生产力,虽然日前存在必定的缺陷和危害,但不发展是最大的不安全。因此,要围绕“应用、平台、数据、治理、人才”这5个关键词,把人工智能从“聊天”推向“制品”。
图为世界工程组织联合会前主席、中国新一代人工智能发展战略科研院执行院长龚克发布主旨演讲。
以下为演讲内容:
今天,咱们该怎么看人工智能?应该从三个重要的方面来看。一是它是一种新兴的生产力,二是它经历了重大的技术突破。第三点亦很重要,它的发展还不成熟,存在危害。
2022年的11月30日,ChatGPT由OpenAI发布。它发布以后产生的效应几乎超出了全部人工智能行业的预料。它能够模仿人类生成文本、图像、视频、音乐、软件代码。这些前所未有的能力让它一下子在不到两个月的时间里面吸引了超过1亿用户,这标志着数字化发展进入到了一个重要的新周期。
这个新周期从技术上看,是ChatGPT依靠大模型和一系列的技术组合造就的。尤其是它实现了对语义的理解,这亦正是非常难但拥有突破性的地区。咱们不要小看了ChatGPT这个应用。过去,人工智能能够和人下围棋,把围棋世界冠军都下赢了,这是很了不起的事,但围棋并不是所有人都能参与的,但每一个人都会“聊天”。这一下子就把人工智能推向了所有人,这一点是前所未有的。我在这次来之前,就向ChatGPT问了一个问题,我问:“山西是煤炭集中的地区,人工智能能为这儿的产业绿色化转型做点什么?”他的回答是:“人工智能能够在山西的煤炭产业转型过程中发挥重要功效。例如,人工智能与新一代数字技术如5G、物联网、大数据、工业互联网等一体化发展,能够推动煤炭上下游产业的协同,加强生产效率和安全性。同期人工智能亦能够用于深化煤炭生产洗选节能降碳行动,有序推动煤炭与新能源优化组合,提高煤炭伴生资源和固体废物综合利用水平,实现煤炭行业的绿色转型发展。”相当可靠的一段话。它还说:“另外,山西省发改委已然发布了《关于煤炭产业和数字技术一体化发展的指点意见》……”我当时专门上网查有无这个指点意见,结果表示真的有。况且我认真读了这个指点意见,发掘它确实抓住了意见中知道提出的“借助新一代数字技术推动煤炭绿色化、智能化改造的目的”这一点。这便是此刻ChatGPT能够达到的程度。
它的这种出乎意料的功能,在导致惊喜的同期亦诱发了非常多专家的担忧。因此,去年3月份有一大批名人集体签名写信需求把人工智能停下来。当然,她们亦阻挡不了先进生产力的发展,阻挡不了这种新兴生产力对旧生产力的替代。由于人类总是持续地创造出新的工具,来提高自己能力,包含咱们的体力和脑力。
因此在过去的一年多的时间里,ChatGPT显现以后,它非但无停止进步,况且还在技术上加速地迭代,产业上亦在高速增长。这个技术迭代咱们能够用一个指标来看。在2022年10月30号推出的ChatGPT,它能够产生的内容有多长?包含标点符号在内是8000个英文字符,大约等于含标点符号在内的4000字的中文。3个月之后就翻了4倍到32000个字符,去年的10月份、11月初,在不到12月时间里面又增长到了128000个。据认识,从去年到2030年,这个产业还将以年均37%的速度增长。
那样为何会有这般大的增长呢?归根到底是由于它就属于咱们说的“新质生产力”。“从社会发展史看,人类经历了农业革命、工业革命,正在经历信息革命”。农业革命和工业革命是都是拓展了人的体力的,而信息革命是加强人的脑力,从而给生产力带来的质的飞跃,便是“新质”,亦能够说是“质变”,不仅是原有量的扩大,而是质的变化。在这个质变过程中,“人工智能是引领这一轮科技革命和产业变革的战略性技术,拥有溢出带动性很强的‘头雁’效应。”这个判断非常重要,在这一轮科技革命和产业变革里,以人工智能为表率的战略技术是关系全局和长远的技术,像“头雁”同样能引领方向。总书记进一步指出,“人工智能加速发展,呈现出深度学习、跨界融合、人机协同、群智开放、自主操控等新特征。”他需求:“要深入把握新一代人工智能发展的特点,加强人工智能和产业发展融合,为高质量发展供给新动能。”这儿有一个词很重要,叫“产业发展融合”。我认为,这不只是技术问题,还需要咱们能突破现有的生产关系和行业管理。如我之前所说,人工智能是一种新型的新质生产力,拥有非常多新的特点。
第二,人工智能技术已然显现了重大的技术突破。突破在什么地区?首要是量变到质变。此刻所有人都谈“大模型”,“大模型”有多大?ChatGPT刚出来的时候,大模型的参数有1750亿这么大的量,从2018年的ChatGPT1,到2019年这个是ChatGPT2,这个参数基本无变,只是算法有改进。然而到了ChatGPT3和去年推出的ChatGPT4,显现了数百倍的增长。在很短的时间里如此快速的量变,于是从量变到质变的规律就发挥功效了。
从1750亿到1万多亿,这个“参数”指的到底是什么?我举个例子。咱们能够模仿人脑或动物的脑来构建神经网络。这个神经网络由非常多神经元形成,神经元相互联系起来,咱们欠好处理,就把它们分成非常多层,层本身互相不联系,每一层都只往下联系,始终到大脑皮层的刺激,到最后的输出。咱们说的参数就像是每一个神经元输出时上面带的系数。咱们晓得,猴子已然算很聪明的动物了,它拥有非常多神经元,但咱们人的神经元比它多得多,因此人会记住非常多东西,会进行繁杂思维,然则单靠多亦是不行的。非洲象的神经元比咱们的多得多,然则并不如咱们聪明。
这就说明,咱们不仅要靠量变把咱们的模型参数增大,还需要新技术的组合。ChatGPT是怎么从输入到输出的呢?这一系列的过程便是把词嵌入进去,“词嵌入”(Embedding)这个词在中文语境中很难理解。词嵌入便是把一个词嵌入到一个高维的空间里面,高维空间里的每一维表率着每一种性质,所有的性质来确定这个词的词义。咱们举个五维的例子,咱们用一维暗示它是生物还是非生物。倘若它是生物的话,那它是植物还是动物?动物的话是哺乳动物还是非哺乳动物?飞的动物还是走的动物?倘若它是走的动物,那它是四条腿的还是两条腿的?用这般的特征空间确定这个词的词义,这就叫做词嵌入技术。
还有一个技术叫做“自重视力”(Self-attention),这个技术能够经过一套机制在非常长的文案里面找到文案的主线是什么、关键点在哪。咱们倘若把一篇领导讲话输进去,它真的能够提炼出3、四条讲话的要点,并加入了它自己的理解。
还有一个比较重要的技术便是人类的反馈强化学习(RLHF)。ChatGPT是可能出错的,ChatGPT需要人来引导的,因此人类反馈强化学习对它非常重要。用这个技术,咱们能够在问答中把咱们人类的价值观、伦理规范、科学知识输入到这个模型中去,加强它的性能。此刻招聘网站有一个非常热门的岗位叫做提示词工程师,她们做的便是给人工智能做人类反馈强化学习这个事的。
正是因为这些新技术,这种大模型的结合,人工智能实现了重要的技术突破。这个技术突破以后会给咱们带来新的工作模式,这个工作模式此刻被叫作作“模型即服务”(MaaS)。以前咱们说软件是服务、网络是服务,此刻模型亦是服务。ChatGPT中的P指“预训练”,在预训练的基本下加上全部行业的模型,就能够训练它的下游任务,完成公式化。预训练模型大大降低了咱们运用人工智能的门槛。这般行业内倘若要做一个模型,不消从头做起了,而是在现有开源的大模型基本上来做,并按照最新的数据做精调,这亦是为何人工智能能进步这么快的道理。
人工智能使生产力有了重大进步,然则它还不成熟,它有一个固有的缺陷。它的生成方式重点靠概率分布。既然依靠的是概率,它就有可能出错。问题不在于依靠概率就出错,人犯错亦是有概率的,咱们平常遇到问题要寻求专家咨询便是要降低人犯错的概率。人工智能犯错的概率是怎么分布的?什么原因能影响它出错?这些问题日前咱们还不太认识,这叫模型的不可解释性。因此说咱们的开发要进一步处理它的可解释性问题,才可有效掌控它的错误概率。因此,咱们说人工智能应用生成的东西是都是“半成品”,不可简单地依赖它,而要对它进行审视。
面对这些危害,咱们该怎么干?去年年底的中央经济工作会议提出“以科技创新引领现代化产业体系建设”,并尤其提出来要“广泛应用数智技术”。我认为,咱们要贯彻好中央经济工作会议的精神,就要围绕“应用、平台、数据、治理、人才”这5个关键词。
首要是应用。咱们必须把人工智能用起来,在用的过程中倘若显现欠好用的现象,咱们就改进,重要的是要学会在应用中学习。此刻有些人觉得自己无学过计算机,更无学过人工智能,因此他就不敢用这些应用了。其实无关系的,它们就像傻瓜相机同样好用。这些应用仅仅被运用了一年就有显著的进步。咱们曾经做过调查,体验过自动驾驶的人对自动驾驶技术的看法比没体验过的人积极得多。因此体验过人工智能的,体验过ChatGPT的人,对这项技术的态度亦会积极得多。所以必定要把它用起来。正所说“纸上得来终觉浅,绝知这事要躬行”。仅有用才可发掘它什么地区好用什么地区欠好用,才会有机会跟别人合作,把它变得越来越好用。
第二,咱们需要平台。人工智能是一个革命性的通用技术,而不是某一个行业的技术。当人工智能进入到某一个行业的时候,它就要和某个行业的知识去结合,此时候就需要平台的支撑了。据咱们观察,全国2205家人工智能企业在技术、资金、人才上是紧密联系的,这种联系的密切程度大大超过了其他同行业企业之间的联系。在这2205家企业里面,咱们观察到有15家企业是科技部挂了牌的人工智能开放创新平台。这15家企业只占所有企业数的千分之七,然则它形成的联系节点数占比到了千分之一百五十,创立的关系数占比千分之一百。说明平台在全部产业中非常重要。平台供给了数据、算法、算力和处理方法。平台还聚集了研发应用者、营销者、投资者,因此呢平台非常重要。因此发展人工智能必定要依托平台,依托平台跨传统行业的界线来进行产业发展融合。不可说机械行业便是机械行业,石油行业便是石油行业,人工智能能穿透这些行业,把这些行业整合起来。另一,人工智能还要跨所有制的界限,跨学科、技术的界限等。
第三,数据。咱们说从通用的模型到行业的模型这个过程中,关键便是要将行业的数据和大模型有效地结合。此刻的问题是咱们各个行业内缺少高质量的数据集,因此咱们必须把行业的、企业的高质量数据集创立起来。因此某个行业人工智能的成熟度在相当程度上要依赖这个行业的数据的成熟度。离开数据的场景,咱们基本没法应用人工智能。
从治理的方向看,人工智能是一种新质生产力,咱们就要按是不是有利于解放和发展人工智能的生产力为需求发展人工智能。由于不发展是最大的不安全。因此,咱们不要仅止于把它管住,还要建平台,做应用示范、安全保证、科学普及等工作。咱们需要科技向善,而不是社会焦虑。
最后咱们说一下人才。去年发布的一项人才需要度的报告表示,人才需要度最高的行业是人工智能、电子芯片、新能源汽车、硬件等等。其中,人工智能对人才的需要量是遥遥领先的。而另一方面,咱们看到企业采用人工智能最大的阻碍是缺乏知道的战略,缺乏适当的人才等。因此,咱们此刻必须立即着手培养和引进人工智能的创新者、应用者和管理者,用优秀的“人工”来保证“智能”的发展。人才是等不来的,而是要在应用中学出来、成长起来的。
归根到底,咱们此刻便是要把人工智能从Chat推向Product,从“聊天”到“制品”。
源自:新华网思客
监制:唐心怡
编辑:马宇聪
校对:王云霞
↓点击下图进入
第十届新华网思客年会(山西)专题页
|