英伟达怎么靠生成式AI挣钱的?
<h1 style="color: black; text-align: left; margin-bottom: 10px;">半导体工程师 2024-03-30 08:19 北京</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">前不久的GTC上,英伟达<span style="color: black;">颁布</span>了一个叫NIM的东西。<span style="color: black;">况且</span><span style="color: black;">颁布</span>会起码1/4的篇幅都在讲NIM。这东西可能与世界的<span style="color: black;">将来</span>有很大的关系...</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">过去1年内,英伟达的市值<span style="color: black;">始终</span>是<span style="color: black;">媒介</span>们关注的焦点:突破万亿、<span style="color: black;">一晚上</span>间又涨了xx、打破记录...前不久的英伟达GTC大会采访<span style="color: black;">时期</span>,黄仁勋谈到:“有人说光是卖芯片,很难卖到2.5万亿市值水平。我<span style="color: black;">没</span>法不赞同这个观点。”“<span style="color: black;">因此</span>英伟达<span style="color: black;">必定</span>不是个芯片<span style="color: black;">机构</span>。”这是他的原话。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">单从英伟达正在出售<span style="color: black;">制品</span>的<span style="color: black;">方向</span>来看,即便是硬件<span style="color: black;">制品</span>,芯片<span style="color: black;">亦</span>的确并非英伟达<span style="color: black;">独一</span>在卖的<span style="color: black;">制品</span>类型,板卡、超级计算机、交换机、机架和计算系统等等都是英伟达在推的<span style="color: black;">制品</span>;<span style="color: black;">况且</span>实际上英伟达的<span style="color: black;">制品</span><span style="color: black;">亦</span>远不限定在硬件方面,各类加速库、中间件、软件、云服务<span style="color: black;">乃至</span>算得上是英伟达生态的核心<span style="color: black;">构成</span>部分...</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>总结今年GTC,黄仁勋<span style="color: black;">颁布</span>的几个核心<span style="color: black;">制品</span><span style="color: black;">包含</span>Blackwell GPU及其系统,面向<span style="color: black;">研发</span>者<span style="color: black;">供给</span>Omniverse Cloud API,人形<span style="color: black;">设备</span>人Project GROOT项目,以及在我们看来<span style="color: black;">这次</span><span style="color: black;">制品</span><span style="color: black;">颁布</span>最<span style="color: black;">要紧</span>的NIM(NVIDIA Inference Microservice,英伟达推理微服务)。超过一半都不是硬件——NIM在<span style="color: black;">咱们</span>看来还将是英伟达<span style="color: black;">将来</span>普及、巩固自家AI生态的<span style="color: black;">重要</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这篇<span style="color: black;">文案</span>,<span style="color: black;">咱们</span>借着NIM来谈谈现<span style="color: black;">周期</span>英伟达眼中的生成式AI,及英伟达的生成式AI生意打算怎么做。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240330/01496c29c90744b5862d5c87d52a8ed2.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;">将来</span>是“生成”的<span style="color: black;">将来</span></strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">黄仁勋在分析师问答会上提出了一个<span style="color: black;">特别有</span>趣的想法。他说<span style="color: black;">咱们</span><span style="color: black;">针对</span>文本、图像、视频、声音等等内容的理解,实现了<span style="color: black;">针对</span>它们的数字化。之<span style="color: black;">因此</span>生成式AI能够与人进行文本和图像的对话沟通,前提在于文本与图像<span style="color: black;">已然</span>被数字化和理解。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“那还有什么是能够实现数字化的?其实<span style="color: black;">咱们</span>还数字化了<span style="color: black;">非常多</span>东西,<span style="color: black;">包含</span>蛋白质、基因、脑波等等——只要<span style="color: black;">咱们</span>理解其结构,<span style="color: black;">或</span>从中抽象出特定的模式,能够理解其内涵,就能做数字化。”黄仁勋说,“<span style="color: black;">那样</span>或许就能够对它们做‘生成’了。这<span style="color: black;">便是</span>生成式AI革命。”换句话说,<span style="color: black;">倘若</span>万物皆可数字化(digitalized),<span style="color: black;">那样</span>万物就可tokenized。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“<span style="color: black;">火速</span>会有个行业是专门生成token的。我<span style="color: black;">晓得</span>这听起来很奇怪。”他用第二次工业革命,即电力革命做类比,“很久之前的工业革命产生了一种新的业务模式,产生的东西<span style="color: black;">亦</span>是看不见的,但<span style="color: black;">咱们</span>后来还<span style="color: black;">必须</span>专门掏钱购买<span style="color: black;">这般</span>的东西,单位是千瓦时,<span style="color: black;">亦</span><span style="color: black;">便是</span>电力。”和发电<span style="color: black;">同样</span>,“<span style="color: black;">咱们</span><span style="color: black;">将来</span>会<span style="color: black;">必须</span>生成信息,生成token”,<span style="color: black;">况且</span>是深刻“融入到生活中(for a living)”。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">从计算机行业的<span style="color: black;">方向</span>来看,以前<span style="color: black;">咱们</span>的<span style="color: black;">运用</span>习惯<span style="color: black;">始终</span>是对已存在信息的“检索/获取(retrieval)”,一切都是预先做好的(pre-recorded),“写入到了文件里面的”,“可能是图像、视频、声音等等”。“就像我今天早上看的<span style="color: black;">资讯</span>,都<span style="color: black;">是由于</span>人们提前写好的。手机上弹出的<span style="color: black;">宣传</span><span style="color: black;">亦</span>是。”</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q5.itc.cn/images01/20240330/ad8dfb16ac384a6783d9cd4fa94bb003.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“而<span style="color: black;">将来</span>则会是生成的。基于种子信息(seeds information),由上下文做加强”,“<span style="color: black;">最后</span>呈现给你的都是生成的”。“<span style="color: black;">此刻</span><span style="color: black;">咱们</span>看手机,上面展示的<span style="color: black;">每一个</span>(图像)像素都是一种重新获取(retrieve)<span style="color: black;">行径</span>。但<span style="color: black;">将来</span>,这些像素都会是生成的。”“大部分计算体验都会是生成的”,“与你交互的大部分东西都会是生成的,<span style="color: black;">由于</span>它能够理解你,理解上下文。”</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">生成的“token<span style="color: black;">能够</span>是化学、医疗、动画、<span style="color: black;">设备</span>人、3D图形”,“<span style="color: black;">倘若</span><span style="color: black;">咱们</span>能够生成文本的下一个token,那就能生成图像、视频、机械臂的下一个token。”黄仁勋说。其实用更通俗的话<span style="color: black;">来讲</span>,现<span style="color: black;">周期</span><span style="color: black;">便是</span>基于文生图生成玩滑板的猫,<span style="color: black;">或</span>让<span style="color: black;">设备</span>人倒杯咖啡这类<span style="color: black;">最后</span>实现。只<span style="color: black;">不外</span><span style="color: black;">此刻</span>共识的实现<span style="color: black;">办法</span>是生成式AI。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">没</span>疑要达成黄仁勋眼中的这种<span style="color: black;">将来</span>,英伟达<span style="color: black;">此刻</span>要做的<span style="color: black;">便是</span><span style="color: black;">连续</span>推广生成式AI,不仅要有Blackwell、GB200-NVL72这类能够算力支撑的硬件,为<span style="color: black;">研发</span>者<span style="color: black;">供给</span>AI<span style="color: black;">研发</span><span style="color: black;">工具</span>,还<span style="color: black;">必须</span>引导<span style="color: black;">不睬</span>解<span style="color: black;">怎样</span>将AI引入到生产力及<span style="color: black;">公司</span>流程中的个人和<span style="color: black;">公司</span>。这应该是形如NIM这类<span style="color: black;">工具</span>诞生的<span style="color: black;">基本</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">让生成式AI设计芯片?</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">英伟达其实<span style="color: black;">始终</span>很清楚,<span style="color: black;">非常多</span><span style="color: black;">公司</span>对AI是存在困惑的,尤其是怎么用,能达成何种效果之类的问题;更<span style="color: black;">不消</span>说对模型做优化,将必要的计算栈都搭建起来。<span style="color: black;">因此</span>黄仁勋说“<span style="color: black;">咱们</span>想了个办法”,“一种让你能够接收和操作软件的办法。软件就放在一个数字盒子里。”“这个盒子<span style="color: black;">便是</span>NIM。”</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在谈NIM<span style="color: black;">到底</span>是什么的问题之前,先聊一个英伟达自己内部<span style="color: black;">已然</span>在用的东西叫ChipNeMo。简单<span style="color: black;">来讲</span>,这是个懂得芯片设计的LLM大语言模型。跟它聊天,就能得到<span style="color: black;">非常多</span><span style="color: black;">关联</span>芯片设计的回答。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">其实在去年GPT大火以后,<span style="color: black;">相关</span>用生成式AI来设计芯片的讨论就时常冒出来。主打的<span style="color: black;">便是</span>不写一行代码,就靠聊、提需求,让LLM写出代码。<span style="color: black;">不外</span>过去一年<span style="color: black;">咱们</span>问了好些EDA<span style="color: black;">公司</span>,这么做是不是真的<span style="color: black;">靠谱</span>。大部分EDA<span style="color: black;">公司</span>的态度都是,真正走向量产的芯片设计真要这么搞,基本是天方夜谭。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q7.itc.cn/images01/20240330/209672bcfdb54dcf9fbdee97b066a437.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">不外</span>起码<span style="color: black;">暗示</span>LLM<span style="color: black;">能够</span>辅助芯片设计。英伟达首席<span style="color: black;">专家</span>Bill Dally在分析师沟通会上说ChipNeMo在内部<span style="color: black;">重点</span>扮演3个角色。其一是让初级水平的芯片设计师,在有问题的时候就直接问ChipNeMo,<span style="color: black;">这般</span>不会浪费<span style="color: black;">哪些</span>高级芯片设计的时间;其次是对bug报告做总结,<span style="color: black;">由于</span>硅工们写的bug报告有时又长又<span style="color: black;">繁杂</span>,<span style="color: black;">况且</span>经常<span style="color: black;">仅有</span><span style="color: black;">自己</span>能看懂,<span style="color: black;">那样</span>ChipNeMo此时就<span style="color: black;">能够</span>为旁人理解bug报告起到很大的<span style="color: black;">帮忙</span><span style="color: black;">功效</span>;最后,ChipNeMo的确能生成Verilog,<span style="color: black;">不外</span><span style="color: black;">通常</span>英伟达不会这么去用...</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个ChipNeMo是怎么做出来的呢?<span style="color: black;">首要</span>以Llama 2 70b为<span style="color: black;">基本</span>模型,放进NIM里面。“<span style="color: black;">倘若</span>你此时问<span style="color: black;">她们</span>,CTL是什么。它给出的回答<span style="color: black;">通常</span>是一种常规知识<span style="color: black;">贮存</span>,不是<span style="color: black;">咱们</span><span style="color: black;">必须</span>的。”<span style="color: black;">由于</span>此时的模型<span style="color: black;">便是</span>个普通的通用<span style="color: black;">基本</span>模型。英伟达要做的是告诉模型,在英伟达的语境中CTL是什么。之后再问它就能得到正确答案。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当然,要让模型专门适配芯片设计,要做的事情不止这一点。<span style="color: black;">倘若</span>你关注过<span style="color: black;">咱们</span>之前对NVIDIA AI的<span style="color: black;">报告</span>,<span style="color: black;">必定</span><span style="color: black;">晓得</span>NeMo。准备好<span style="color: black;">关联</span>数据,基于NeMo服务来对<span style="color: black;">基本</span>模型进行fine-tune, guardrail...<span style="color: black;">详细</span>的流程参见下图。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240330/2badeff0c2484e1d855642a7324d14d2.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">对用户<span style="color: black;">来讲</span>,这其中三个核心<span style="color: black;">构成</span>部分,<span style="color: black;">第1</span>是要有个AI模型,以及能跑AI模型——这是英伟达要先打包给用户的;第二,<span style="color: black;">必须</span>有<span style="color: black;">这般</span>一个<span style="color: black;">工具</span>对模型做“修改”;第三是<span style="color: black;">安排</span>,不管是<span style="color: black;">安排</span>到DGX Cloud云上,还是<span style="color: black;">安排</span>在本地<span style="color: black;">基本</span><span style="color: black;">设备</span>。完成以后,就能把这东西打包带走了。这<span style="color: black;">便是</span>NIM。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">听起来是不是颇有一种<span style="color: black;">公司</span>版Chat with RTX的感觉——Chat with RTX是面向个人用户,<span style="color: black;">能够</span>一键安装,<span style="color: black;">而后</span>加入本地数据,基于你电脑上的个人信息,与AI对话的应用。<span style="color: black;">不外</span>Chat with RTX的<span style="color: black;">外边</span>数据结合,用的是RAG(retrieval augmented generation),前不久<span style="color: black;">咱们</span>还在<span style="color: black;">文案</span>里提过。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">况且</span>很巧的是,GTC<span style="color: black;">时期</span>,在一场面向分析师的问答会上,英伟达好几名高层都认为,<span style="color: black;">公司</span>最初还不确定对AI投入多少的时候,都倾向于<span style="color: black;">选取</span>RAG,<span style="color: black;">由于</span>这是<span style="color: black;">公司</span>自己应用生成式AI最简单的方式。<span style="color: black;">乃至</span>有人<span style="color: black;">说到</span>,RAG<span style="color: black;">针对</span><span style="color: black;">初期</span>的<span style="color: black;">公司</span>AI应用而言是个PoC——概念验证。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“而今年人们会真的<span style="color: black;">起始</span>去打造有价值的AI<span style="color: black;">制品</span>,真正着眼在整体。”这仿佛<span style="color: black;">便是</span>NIM诞生的<span style="color: black;">基本</span>,<span style="color: black;">亦</span>是英伟达推GB200-NVL72这类硬件<span style="color: black;">制品</span>的<span style="color: black;">基本</span>。换句话说,<span style="color: black;">便是</span>在英伟达看来,过了最<span style="color: black;">初期</span>的探索,<span style="color: black;">公司</span><span style="color: black;">逐步</span>要认真<span style="color: black;">思虑</span>用AI技术了,那<span style="color: black;">便是</span>时候给<span style="color: black;">她们</span><span style="color: black;">供给</span><span style="color: black;">基本</span><span style="color: black;">设备</span>、<span style="color: black;">供给</span><span style="color: black;">工具</span>了。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">有一种定位叫AI Foundry</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">这儿</span>把NIM再说得<span style="color: black;">知道</span><span style="color: black;">有些</span>:英伟达给出<span style="color: black;">有些</span>LLM模型,其中有些是英伟达自己做的,有些是开源的,还有<span style="color: black;">有些</span>来自合作伙伴。<span style="color: black;">公司</span>客户<span style="color: black;">能够</span>直接拿来用,<span style="color: black;">况且</span><span style="color: black;">能够</span>基于自家内部数据,借助英伟达的<span style="color: black;">工具</span>,来fine-tune这些模型,真正让模型为自己所用。形<span style="color: black;">影像</span>ChipNeMo<span style="color: black;">这般</span>的<span style="color: black;">工具</span>。这个服务叫做NIM。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">不外</span><span style="color: black;">倘若</span>要说NIM的确切<span style="color: black;">形成</span>,<span style="color: black;">实质</span>还是比较<span style="color: black;">繁杂</span>的,<span style="color: black;">包含</span><span style="color: black;">各样</span>预训练模型、及<span style="color: black;">各样</span>跑模型的依赖包,如CUDA, CuDNN, TensorRT-LLM, Triton Inference Server等等……上接AI API。这部分咱就不细说了,有兴趣的去<span style="color: black;">科研</span>下英伟达的博客与文档——<span style="color: black;">不外</span>从这些中间件,其实<span style="color: black;">亦</span>能看出,英伟达要为<span style="color: black;">公司</span><span style="color: black;">处理</span>模型优化之类的问题,而不单是<span style="color: black;">供给</span>和修改模型(当然<span style="color: black;">重要</span><span style="color: black;">亦</span><span style="color: black;">包含</span>要卖跑在下面的硬件,和NVIDIA AI<span style="color: black;">公司</span><span style="color: black;">处理</span><span style="color: black;">方法</span>)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">尔后,<span style="color: black;">公司</span><span style="color: black;">能够</span><span style="color: black;">创立</span><span style="color: black;">非常多</span>个NIM,<span style="color: black;">或</span>说<span style="color: black;">非常多</span>个AI聊天<span style="color: black;">设备</span>人。某些工作是<span style="color: black;">必须</span>指派给<span style="color: black;">区别</span>的AI去分别完成的,<span style="color: black;">区别</span>的NIM<span style="color: black;">能够</span><span style="color: black;">协同</span>工作。关于多个NIM间的协作,黄仁勋做了举例说明,但<span style="color: black;">咱们</span>没能完全理解。<span style="color: black;">不外</span>框架大致<span style="color: black;">便是</span>这个样子了。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">针对</span><span style="color: black;">持有</span><span style="color: black;">海量</span>数据,但不<span style="color: black;">晓得</span>该怎么用来搞AI的<span style="color: black;">公司</span>而言,NIM理论上会是个不错的<span style="color: black;">工具</span>。<span style="color: black;">由于</span>NIM的价值之一,<span style="color: black;">便是</span>对<span style="color: black;">公司</span>专用的数据做出理解——<span style="color: black;">形成</span>专门的AI数据库,<span style="color: black;">而后</span>进行“re-index”——re-index这个词感觉用在<span style="color: black;">这儿</span><span style="color: black;">尤其</span>合适。用户就<span style="color: black;">能够</span>和<span style="color: black;">这般</span>的AI对话了——它和ChatGPT有着很大<span style="color: black;">区别</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q9.itc.cn/images01/20240330/ada17689cfc44a92b70067e5e58614a4.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">这儿</span><span style="color: black;">供给</span>给NIM的<span style="color: black;">公司</span>私有数据<span style="color: black;">能够</span>是多模态的,<span style="color: black;">例如</span>说PDF文档。至于<span style="color: black;">详细</span>是什么样的数据,<span style="color: black;">例如</span>说<span style="color: black;">针对</span>软件团队<span style="color: black;">来讲</span>,<span style="color: black;">能够</span>是一堆平常写的bug报告和总结。<span style="color: black;">那样</span>工程师就能和AI对谈<span style="color: black;">相关</span><span style="color: black;">机构</span>软件的bug问题,不管是<span style="color: black;">此刻</span>有多少bug,还是<span style="color: black;">处理</span><span style="color: black;">状况</span>怎么样等等。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">黄仁勋在<span style="color: black;">这儿</span>列举了一个多NIM的例子。<span style="color: black;">例如</span>你<span style="color: black;">做为</span><span style="color: black;">机构</span>软件工程师,和<span style="color: black;">这般</span>一个bug聊天AI对话以后觉得非常受挫,就<span style="color: black;">能够</span>去和另一个专职心理健康的AI继续对话,接受安慰和心理辅导——后者<span style="color: black;">亦</span><span style="color: black;">能够</span>是基于NIM做出来的…</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当然了,他举这个例子应该纯粹是为了谈Hippocratic AI的LLM,<span style="color: black;">协同</span>NVIDIA ACE打造的医疗健康数字人的;不<span style="color: black;">太多</span>NIM协作大概<span style="color: black;">便是</span>这么个意思了。医疗健康<span style="color: black;">亦</span>是英伟达这次谈及的重点,本文就不做展开了。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">如此一来,所有的<span style="color: black;">公司</span>都<span style="color: black;">能够</span>做出属于自己的Copilot,属于自己的对话AI——不管这个Copilot是面向<span style="color: black;">公司</span>内部,还是<span style="color: black;">做为</span>服务<span style="color: black;">供给</span>给客户。黄仁勋在主题演讲中宣布了不少NIM<span style="color: black;">关联</span>的首波<span style="color: black;">公司</span>合作,<span style="color: black;">包含</span>SAP, ServiceNow, Dell, Cohesity等。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">值得一提的是,<span style="color: black;">做为</span>一种试用手段,英伟达还<span style="color: black;">尤其</span>开放了ai.nvidia.com这么个网址,<span style="color: black;">供给</span>相对直观的NIM试用。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">这里</span><span style="color: black;">时期</span>,黄仁勋反复<span style="color: black;">说到</span>了英伟达<span style="color: black;">做为</span>“AI foundry”的设定,说法上是<span style="color: black;">针对</span>LLM,“并非创造,而是生产(not create it, but manufacture it)”,是为英伟达<span style="color: black;">做为</span>AI foundry的定位。“你去跑这些模型,规模化运行的时候,向<span style="color: black;">咱们</span>支付的其实只是AI操作系统的钱。”黄仁勋说,“操作系统<span style="color: black;">亦</span><span style="color: black;">便是</span>NVIDIA AI Enterprise”,“非常划算”…就差没讲“buy more, save more”了…</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">而AI foundry的本意,<span style="color: black;">亦</span>在于让<span style="color: black;">公司</span>客户的AI模型用于生产环境。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q7.itc.cn/images01/20240330/f2ca22d942ff45ec939ab5c22e7b1eb1.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">GPU回归“生成”的最初使命</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">最后谈一谈NIM的潜在可能性。<span style="color: black;">咱们</span><span style="color: black;">针对</span>NIM的<span style="color: black;">第1</span>眼认知是,这是英伟达普及、巩固AI生态的<span style="color: black;">制品</span>。虽然这两年<span style="color: black;">咱们</span><span style="color: black;">始终</span>在谈AI,但各行各业<span style="color: black;">针对</span>AI,尤其是生成式AI的利用还非常<span style="color: black;">初期</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">就如前文谈到的,即便是最前沿的电子科技<span style="color: black;">公司</span>,初期都还在用RAG做AI的PoC。可见AI的发展之路还很长。英伟达一方面要把AI的蛋糕真正做大,另一方面则要尽可能利用现有资源,来<span style="color: black;">连续</span>巩固自己在AI<span style="color: black;">行业</span>的地位——不仅要降低<span style="color: black;">公司</span>用AI的门槛,<span style="color: black;">同期</span>借助与模型合作伙伴的合作,让<span style="color: black;">更加多</span>的AI资源为自己所用。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">NIM显然是肩负了<span style="color: black;">这般</span>的职责的。虽然听起来<span style="color: black;">咱们</span>对NIM的定位似乎有些过于高估了。但<span style="color: black;">咱们</span><span style="color: black;">能够</span>等等看接下来英伟达<span style="color: black;">针对</span>NIM的推广会是怎么样。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q6.itc.cn/images01/20240330/c4591ff6863543be9c313bd180f87022.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">回到最初谈世界<span style="color: black;">最后</span>会像需求电力<span style="color: black;">同样</span>,需求“生成token”的疯狂说法——其实黄仁勋的这一说法或许仍然<span style="color: black;">没</span>法被大<span style="color: black;">都数</span>人所接受,尤其从<span style="color: black;">规律</span>上要理解“生成”什么,人们又<span style="color: black;">怎样</span>像消费电力<span style="color: black;">同样</span>消费“生成”内容的问题。这就只能交给时间去评断了。但千行百业都真正<span style="color: black;">起始</span>用AI、生成式AI,这才是世界、个人<span style="color: black;">最后</span>全面步入AI的开端。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">有个<span style="color: black;">相关</span>“生成”和英伟达自己的说法<span style="color: black;">特别有</span>趣。“30年后的今天,<span style="color: black;">咱们</span>又回到了最初的那个<span style="color: black;">咱们</span>。”黄仁勋所说的“最初的”英伟达,<span style="color: black;">指的是</span>最初做图形渲染加速的英伟达。<span style="color: black;">由于</span>GPU曾经<span style="color: black;">便是</span>干“生成内容”这个活儿的。“<span style="color: black;">咱们</span>生<span style="color: black;">成为了</span><span style="color: black;">非常多</span>东西,<span style="color: black;">便是</span>计算机图形。”</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“<span style="color: black;">咱们</span><span style="color: black;">此刻</span>要回到那里了。只<span style="color: black;">不外</span><span style="color: black;">此刻</span>用来‘生成’的计算机更大了,<span style="color: black;">况且</span>是为<span style="color: black;">每一个</span>人‘生成’。”这还真是<span style="color: black;">相关</span>AI和图形,相当浪漫主义的一种说法。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">源自</span>于电子工程专辑,作者黄烨锋</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">半导体工程师半导体经验分享,半导体成果交流,半导体信息<span style="color: black;">颁布</span>。半导体行业动态,半导体从业者职业规划,芯片工程师成长历程。<a style="color: black;"><span style="color: black;">返回<span style="color: black;">外链论坛:http://www.fok120.com/</span>,查看<span style="color: black;">更加多</span></span></a></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">责任编辑:网友投稿</span></p>
太棒了、厉害、为你打call、点赞、非常精彩等。 i免费外链发布平台 http://www.fok120.com/ 你的话语如春风拂面,让我心生暖意。 楼主果然英明!不得不赞美你一下! 你的见解独到,让我受益匪浅,非常感谢。 我深受你的启发,你的话语是我前进的动力。 太棒了、厉害、为你打call、点赞、非常精彩等。
页:
[1]