j8typz 发表于 2024-8-22 08:58:36

什么是ChatGPT


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><a style="color: black;">#长文创作激励计划#</a></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2022年11月,OpenAI推出了人工智能聊天<span style="color: black;">设备</span>人:ChatGPT。该应用发布后,<span style="color: black;">火速</span>就<span style="color: black;">作为</span>学术界、工业界、<span style="color: black;">商场</span>界、产业界...方面关注的焦点,<span style="color: black;">咱们</span><span style="color: black;">起始</span>广泛讨论、<span style="color: black;">科研</span>及操作应用ChatGPT,<span style="color: black;">那样</span><span style="color: black;">到底</span>什么是ChatGPT呢?</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/8c9a73c13ed64c99b6eb76e9897a0a94~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1724859182&amp;x-signature=IOREnVT4dJBLvAfEV%2FU0ztYRHzg%3D" style="width: 50%; margin-bottom: 20px;"></div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">ChatGPT最直观的感知<span style="color: black;">便是</span>:它是一个“聪明”的聊天<span style="color: black;">设备</span>人(工具);除了聊天工具,它实质是一个人工智能模型,<span style="color: black;">亦</span>是一种自然语言处理工具,英文全<span style="color: black;">叫作</span>为:“Chat Generative Pre-trained Transformer”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">ChatGPT的本质是:<span style="color: black;">经过</span><span style="color: black;">海量</span>的文本数据训练,ChatGPT“学会”了理解和生成人类的语言。<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">经过</span>聊天(问答)的方式,与它展开如科学、哲学、艺术、美术、体育、音乐、电影等等多方面、深层次的<span style="color: black;">关联</span><span style="color: black;">专题</span>交流。<span style="color: black;">咱们</span><span style="color: black;">亦</span><span style="color: black;">能够</span>向它提出请求,<span style="color: black;">例如</span>让它对对联、编一个笑话、画一幅画等等。ChatGPT能够<span style="color: black;">回复</span><span style="color: black;">咱们</span>的任何问题或请求,并且能够给出一个相对完整、准确的回复。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">需要<span style="color: black;">尤其</span><span style="color: black;">重视</span>的是,<span style="color: black;">一般</span><span style="color: black;">咱们</span>说到ChatGPT时,可能指的<span style="color: black;">便是</span>2022年11月发布的那个最初<span style="color: black;">导致</span>全世界各界关注的GPT-3.5版本。而OpenAI<span style="color: black;">机构</span><span style="color: black;">已然</span>在2023年3月发布了更“聪明”、更强大的GPT-4,<span style="color: black;">因此</span><span style="color: black;">咱们</span>在谈ChatGPT时,虽然这两个版本的性质和用法是<span style="color: black;">同样</span>的,但在<span style="color: black;">详细</span>的功能和效果方面会有差异。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/d7c705c855f8402882c80ec4075b15f5~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1724859182&amp;x-signature=%2FO1fo702lYY2OOoxnYpO%2F6lgayI%3D" style="width: 50%; margin-bottom: 20px;"></div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">说到ChatGPT,<span style="color: black;">咱们</span><span style="color: black;">首要</span>要理解和认知“语言模型”。语言是<span style="color: black;">咱们</span>人类最重要的沟通工具。<span style="color: black;">咱们</span><span style="color: black;">每日</span>都在<span style="color: black;">运用</span>语言(<span style="color: black;">不仅</span>指说话)——无论是聊天、阅读、写作,还是思考。而<span style="color: black;">经过</span>让计算机进行学习、理解和<span style="color: black;">运用</span>语言,<span style="color: black;">这般</span>的过程和方式,<span style="color: black;">咱们</span><span style="color: black;">叫作</span>之为“语言模型”。而ChatGPT<span style="color: black;">便是</span><span style="color: black;">这般</span>一种语言模型(<span style="color: black;">亦</span><span style="color: black;">便是</span>语言模型<span style="color: black;">能够</span>有<span style="color: black;">非常多</span>,ChatGPT只是其中之一)。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span>,语言模型<span style="color: black;">到底</span>是什么呢?看<span style="color: black;">这般</span>说明<span style="color: black;">是不是</span><span style="color: black;">能够</span>理解:它是一种预测下一个token(自然语言处理的单位,<span style="color: black;">能够</span>简单地理解为词)的统计模型。举一个例子:<span style="color: black;">倘若</span><span style="color: black;">咱们</span>输入“我爱”,语言模型会预测“你”是接下来<span style="color: black;">特别有</span>可能<span style="color: black;">显现</span>的词。<span style="color: black;">由于</span><span style="color: black;">按照</span>它训练过(统计出)的<span style="color: black;">海量</span>数据资料<span style="color: black;">表示</span>,“我爱你”是一个很<span style="color: black;">平常</span>的短语,在数据资料中<span style="color: black;">显现</span>“我爱你”的短语频率远高于“我爱笑”、“我爱吃”、“我爱说”等等其他短语。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">再<span style="color: black;">例如</span>说,<span style="color: black;">咱们</span>输入“生日快”,语言模型会“<span style="color: black;">精细</span>地”预测出“乐”这个词。<span style="color: black;">由于</span>语言模型在训练过程中,在前面这个短语<span style="color: black;">显现</span>的<span style="color: black;">状况</span>下,后面这个词<span style="color: black;">显现</span>的概率几乎是百分之百。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/8e89975ff7914816bd10c6bab6812c6e~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1724859182&amp;x-signature=BQq72zDnaoxpBHqE7t7jjohwzek%3D" style="width: 50%; margin-bottom: 20px;"></div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,最简单的理解,语言模型<span style="color: black;">便是</span>会<span style="color: black;">按照</span><span style="color: black;">咱们</span>输入词的序列排布<span style="color: black;">状况</span>(短语),结合它“见过”的所有词序列组合(长句),再<span style="color: black;">按照</span><span style="color: black;">这般</span>的词序列组合<span style="color: black;">显现</span>的频率,来预测下一个最有可能<span style="color: black;">显现</span>的词是哪个词。<span style="color: black;">按照</span><span style="color: black;">这般</span>的语言样本进行概率统计解析,<span style="color: black;">便是</span>语言模型。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span>,语言模型长什么样子呢?为了<span style="color: black;">帮忙</span>理解,<span style="color: black;">这儿</span>简单打个比方,<span style="color: black;">咱们</span><span style="color: black;">能够</span>想象有<span style="color: black;">这般</span>一张巨大的表格,这张表格列出了所有词的序列组合以及这个词序列组合<span style="color: black;">显现</span>的频率。当<span style="color: black;">咱们</span>输出某个词序列时,语言模型会在这张表格中找出与之最匹配的词序列,并给出(<span style="color: black;">叫作</span>之为预测)其后面最<span style="color: black;">平常</span>的那个词。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当然,真实的语言模型远比表格<span style="color: black;">繁杂</span>得多。它<span style="color: black;">运用</span>“神经网络”和“深度学习”算法来构建<span style="color: black;">这般</span>的“表格”,<span style="color: black;">触及</span>成千上百万个词及其词序列,还<span style="color: black;">思虑</span>了上下文语义等要素。但本质上,语言模型它所做的事情<span style="color: black;">便是</span>预测下一个最有可能<span style="color: black;">显现</span>的词。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,<span style="color: black;">咱们</span>用计算机(<span style="color: black;">设备</span>)来“预测下一个词”的<span style="color: black;">行径</span>或动作,说起来有点无聊、无趣、无<span style="color: black;">道理</span>,可结果却产生了ChatGPT这个划时代的人工智能<span style="color: black;">制品</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">严格<span style="color: black;">来讲</span>,ChatGPT属于语言模型中的大语言模型(Large Language Model,LLM)。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;">
      <div style="color: black; text-align: left; margin-bottom: 10px;">
            <div style="color: black; text-align: left; margin-bottom: 10px;">
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">中文名<span style="color: black;">叫作</span></strong></p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">英文名<span style="color: black;">叫作</span></strong></p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">说明</strong></p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">语言模型</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Language</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Model</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">对词序列的生成可能性进行建模,以预测下一个token(自然语言处理单位)的概率</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">统计语言</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Statistical</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Language</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Model</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">自然语言模型的<span style="color: black;">基本</span>模型,从概率统计<span style="color: black;">方向</span>出发,<span style="color: black;">处理</span>自然语言上下文<span style="color: black;">关联</span>的特性,如<span style="color: black;">按照</span><span style="color: black;">近期</span>的上下文预测下一个词</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经语言</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Neural</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Language</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Model</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">经过</span>神经网络(如递归神经网络RNN)表征词序列的概率</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">预训练</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">语言模型</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Pre-trained</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Language</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Model</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型参数<span style="color: black;">再也不</span>是随机初始化的,而是<span style="color: black;">经过</span><span style="color: black;">有些</span>任务进行了预先训练,得到一套模型参数,<span style="color: black;">经过</span>这些参数再对模型进行训练</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">大语言</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">模型</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Large</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Language</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Model</p>
                <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在预训练语言模型的<span style="color: black;">科研</span>过程中,<span style="color: black;">科研</span>人员<span style="color: black;">发掘</span><span style="color: black;">增多</span>模型大上和数据量<span style="color: black;">能够</span><span style="color: black;">加强</span>下游任务的完成质量,并且随着规模增大,模型展现出了<span style="color: black;">有些</span>让人意想不到的能力(如ChatGPT)</p>
            </div>
      </div>
    </div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表:语言模型与说明</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">理解和认知好“语言模型”,<span style="color: black;">咱们</span>再来进一步<span style="color: black;">认识</span>ChatGPT。“Chat”(聊天)非常好理解,<span style="color: black;">咱们</span>把焦点放在“GPT”这三个字母上。GPT是Generative Pre-trained Transformer的缩写,中文是“生成式预训练变换模型”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Generative(生成式)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">GPT是一种生成式人工智能。它<span style="color: black;">经过</span>计算海量数据中的概论和分布,<span style="color: black;">最后</span><span style="color: black;">能够</span>从分布中生成新的数据。<span style="color: black;">因此</span>,GPT<span style="color: black;">能够</span>用于<span style="color: black;">各样</span>任务,如写作、翻译、回答问题等等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Pre-trained(预训练)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Pre-trained即预训练,指的是GPT这个模型的训练方式。预训练<span style="color: black;">指的是</span>在训练特定任务的模型之前,先在<span style="color: black;">海量</span>的数据上进行训练,以学习<span style="color: black;">有些</span><span style="color: black;">基本</span>的、通用的特征或模式。用于预训练的数据<span style="color: black;">一般</span>是未标注过的,这<span style="color: black;">寓意</span>着模型需要自我<span style="color: black;">发掘</span>数据中的规律和结构,而不是依赖已标注的信息进行学习。<span style="color: black;">运用</span>无标注数据的训练方式<span style="color: black;">一般</span>被<span style="color: black;">叫作</span>为“无监督学习”。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个预训练过程使得GPT能够学习到语言的<span style="color: black;">通常</span>模式和结构。<span style="color: black;">而后</span>,GPT<span style="color: black;">能够</span><span style="color: black;">经过</span>在有标签的数据上进行微调,来适应<span style="color: black;">各样</span>任务场景。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Transformer(变换模型)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Transformer这个词,直译成中文<span style="color: black;">能够</span>是“改变者”、“变换器”,在GPT这个语境中,我们理解为变换模型,这是GPT的<span style="color: black;">基本</span>架构。Transformer是<span style="color: black;">设备</span>学习算法中的一种深度学习模型,它<span style="color: black;">运用</span>自<span style="color: black;">重视</span>力机制来处理序列数据。这使得GPT能够有效地处理长文本,并<span style="color: black;">捉捕</span>到文本中的<span style="color: black;">繁杂</span>模式。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">而自<span style="color: black;">重视</span>力机制(self-Attention)又是 Transformer的核心<span style="color: black;">构成</span>部分。这种机制的<span style="color: black;">重点</span><span style="color: black;">规律</span>是在处理序列的<span style="color: black;">每一个</span>元素时,不仅<span style="color: black;">思虑</span>该元素本身,还<span style="color: black;">思虑</span>与其<span style="color: black;">关联</span>的其他元素。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">亦</span><span style="color: black;">便是</span>说,Transformer<span style="color: black;">能够</span>为语言模型<span style="color: black;">供给</span>一种“找到<span style="color: black;">目的</span>”的能力,它<span style="color: black;">能够</span>对输入的文本中的<span style="color: black;">每一个</span>词进行多维度、精细化的权重分配,<span style="color: black;">而后</span>进行权重比较,从而<span style="color: black;">帮忙</span>模型理解文本中各词之间的依赖和<span style="color: black;">相关</span>关系,使其<span style="color: black;">再也不</span>机械化、固定地对待每一个词,而是<span style="color: black;">能够</span>像人类<span style="color: black;">同样</span>有<span style="color: black;">选取</span>性地关注与理解信息。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-6w9my0ksvp/6852341c6aca40709de6285480c11e3f~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1724859182&amp;x-signature=LjvjOo6sc8dlFtqM95x086UeOn8%3D" style="width: 50%; margin-bottom: 20px;"></div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,当<span style="color: black;">咱们</span>说“GPT”时,其实指的是一种能够生成新的连贯文本(<span style="color: black;">能够</span>回答问题、写作、聊天等),在高质量的海量数据上进行预训练(论文、书籍、文献等,天文地理,知识百科),并<span style="color: black;">运用</span>Transformer架构(能够<span style="color: black;">捉捕</span>文本中各词之间的依赖和<span style="color: black;">相关</span>关系)的深度学习模型。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">综上,<span style="color: black;">咱们</span>回答“什么是<span style="color: black;"><span style="color: black;">ChatGPT”,它是一种基于人工智能的自然语言处理(NLP)模型;由OpenAI<span style="color: black;">研发</span>,<span style="color: black;">运用</span>深度学习技术,应用变换器(Transformer)架构,来理解和生成人类语言。</span></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以下是近年来<span style="color: black;"><span style="color: black;">ChatGPT<span style="color: black;">关联</span>的重要节点:</span></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2017年,谷歌发布了关于Transformer的论文;</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2018年,OpenAI发布了GPT-1;</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2020年,OpenAI发布了GPT-3;</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">此后,OpenAI在GPT-3的<span style="color: black;">基本</span>上进行人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)和监督精调(Supervised Fine-tuning);经数次迭代之后,ChatGPT(GPT-3.5)横空出世,于2022年11月发布,<span style="color: black;">作为</span>全世界的焦点。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2023年3月,OpenAI发布GPT-4。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">ChatGPT是一个强大、灵活且聪明的人工智能助手,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">经过</span>对话式的聊天与其沟通。它有能力回答<span style="color: black;">咱们</span>的<span style="color: black;">各样</span>问题,<span style="color: black;">帮助</span><span style="color: black;">咱们</span>提炼、写作与思考。然而,<span style="color: black;">倘若</span>仅将ChatGPT看作一个聊天<span style="color: black;">设备</span>人,那就远远低估了它的能力,其<span style="color: black;">实质</span>的应用<span style="color: black;">潜能</span>远超<span style="color: black;">咱们</span>的想象。</span></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">随着<span style="color: black;"><span style="color: black;">ChatGPT等大语言模型能力的<span style="color: black;">提高</span>和应用的拓展,它们将会在不久的将来,颠覆<span style="color: black;">咱们</span> 日当前<span style="color: black;">平常</span>工作、学习、生活的流程和方式。这不是科幻,而是正在逐步<span style="color: black;">出现</span>的现实改变。</span></span></p>




页: [1]
查看完整版本: 什么是ChatGPT