7wu1wm0 发表于 2024-8-31 05:49:36

怎么样训练优化“AI神经网络”模型?


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在上一篇<span style="color: black;">文案</span>中,<span style="color: black;">咱们</span><span style="color: black;">仔细</span>介绍了神经网络的基本概念和原理,神经网络的<span style="color: black;">优良</span>和应用场景,以及神经网络的<span style="color: black;">制品</span>案例:网易有道AI翻译。<span style="color: black;">倘若</span>想<span style="color: black;">认识</span>神经网络的<span style="color: black;">更加多</span>详情,<span style="color: black;">能够</span>翻阅我之前写的《8000字干货说清楚AI<span style="color: black;">制品</span>经理必修的“神经网络” 》</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在<span style="color: black;">认识</span>神经网络的结构和原理后,我产生了进一步的好奇,明明<span style="color: black;">便是</span><span style="color: black;">有些</span>抽象的数学模型却<span style="color: black;">能够</span>实现类似人脑的智慧,神经网络是<span style="color: black;">怎样</span><span style="color: black;">经过</span>数据训练来实现<span style="color: black;">这般</span><span style="color: black;">奥妙</span>的效果呢?本篇就以这个问题<span style="color: black;">做为</span>切入点来展开说说。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本篇为<span style="color: black;">大众</span>揭晓,AI如此“神机妙算”的<span style="color: black;">背面</span>,<span style="color: black;">亦</span>是需要经历一段训练过程的,<span style="color: black;">怎样</span>训练AI神经网络?又<span style="color: black;">怎样</span>识别训练过程是有效的?</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/18864dd447534832b259e34028b50085~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=ydDt8GyTY5XYXL%2FpnX3pgubuIgw%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在这个碎片化学习的环境中,<span style="color: black;">亦</span>许<span style="color: black;">已然</span>很少有人<span style="color: black;">能够</span>沉下心来看完一篇长文了,但我还是<span style="color: black;">期盼</span>你<span style="color: black;">能够</span><span style="color: black;">保持</span>看完,相信会给你带来不<span style="color: black;">同样</span>的,更深厚的收获。 <span style="color: black;">按例</span>,开篇<span style="color: black;">供给</span>本篇<span style="color: black;">文案</span>结构导图,方便<span style="color: black;">大众</span>在阅读前总揽全局,有大致的画面框架。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/bcafa8f8532b8e36b7d2d7ac9fb0d24c~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=uTTFX7fWveS10JA7wtZTeoyOO6U%3D" style="width: 50%; margin-bottom: 20px;">
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">1、</span>AI神经网络需要被训练后,<span style="color: black;">才可</span>派上用场</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">看过上一篇<span style="color: black;">文案</span>的<span style="color: black;">伴侣</span>会<span style="color: black;">晓得</span>,神经网络中有两个<span style="color: black;">重点</span>部分,:结构和权重。结构<span style="color: black;">包含</span>神经元及其连接, 权重是一些数字,是连接神经元之间的参数。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它们<span style="color: black;">能够</span>微调神经元中的数学运算方式,从而得到一个输出。<span style="color: black;">倘若</span>神经网络犯了错误,<span style="color: black;">亦</span><span style="color: black;">便是</span>说输出的结果和预期不符,这<span style="color: black;">一般</span><span style="color: black;">寓意</span>着权重<span style="color: black;">无</span>正确<span style="color: black;">调节</span>,<span style="color: black;">咱们</span>需要更新它们,以便它们下次做出更好的预测。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">听起来是不是觉得很简单,其实这<span style="color: black;">背面</span>的训练过程是很<span style="color: black;">繁杂</span>的,我<span style="color: black;">这般</span>说只是为了好理解<span style="color: black;">有些</span>。但<span style="color: black;">咱们</span>毕竟是在讨论AI<span style="color: black;">行业</span>的知识,内容中<span style="color: black;">没法</span>避免会遇到<span style="color: black;">有些</span>专业词汇,于是乎,后面讲到了我再逐一解释吧。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经网络中的权重决定了<span style="color: black;">区别</span>神经元之间的连接强度,为神经网络结构找到最佳权重的过程<span style="color: black;">叫作</span>为优化。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经网络<span style="color: black;">做为</span>一种模型,想让它真正有“神机妙算”的本领,就需要<span style="color: black;">咱们</span>用<span style="color: black;">海量</span>的数据去训练它,未被训练过的模型<span style="color: black;">常常</span>容易给出<span style="color: black;">非常多</span>的错误答案,这<span style="color: black;">亦</span>是<span style="color: black;">为何</span>市面上<span style="color: black;">那样</span>多AI模型,需要被数据<span style="color: black;">海量</span>训练后<span style="color: black;">才可</span>真正面市了。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">接下来,<span style="color: black;">咱们</span><span style="color: black;">能够</span>再追问一步,计算机是<span style="color: black;">怎样</span><span style="color: black;">经过</span>数据训练并优化神经网络的呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">说到</span>训练神经网络,<span style="color: black;">咱们</span>就离不开被数学<span style="color: black;">安排</span>的现实,神经网络的每一个神经元中都装着数学模型,若以非线性函数来举例解释神经网络的训练过程,些许复杂了,<span style="color: black;">亦</span><span style="color: black;">很难</span>理解。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">还是以线性回归为例吧,毕竟本篇的重点不是在数学模型上,而是说清楚神经网络是<span style="color: black;">怎样</span>训练和优化的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,<span style="color: black;">咱们</span>以线性回归为例,来聊聊神经网络的训练优化策略。</p>
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">2、</span>以线性回归为例的训练优化策略</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">线性回归是一种统计学<span style="color: black;">办法</span>,用于<span style="color: black;">科研</span>两个或多个变量之间的关系。它基于一个假设,即观察到的数据点<span style="color: black;">能够</span><span style="color: black;">经过</span>一条直线(在二维空间中)或一个超平面(在多维空间中)进行最佳拟合。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">线性回归的<span style="color: black;">目的</span>是找到这条直线或超平面的参数,使得预测值与<span style="color: black;">实质</span>观测值之间的误差最小化。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">基于线性回归的概念和特点,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">发掘</span>,在<span style="color: black;">设备</span>学习<span style="color: black;">行业</span>,线性回归<span style="color: black;">能够</span>用来做数据预测。<span style="color: black;">经过</span>拟合数据点的最佳直线,<span style="color: black;">咱们</span><span style="color: black;">能够</span>预测连续值的结果。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">例如</span>,<span style="color: black;">咱们</span>想要知道一家度假村的游客人数和气温之间有什么关系,<span style="color: black;">咱们</span>需要<span style="color: black;">晓得</span>过去的数据,<span style="color: black;">按照</span>历史数据找到和数据最拟合的公式,假设这个公式可视化为一条折线图,<span style="color: black;">能够</span>直观<span style="color: black;">暗示</span>两个数据之间的关系。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/70fc8b0e24092055454fe863a1a3066f~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=iDmX%2Bd%2FxIaoF5pSK6mAVGFY0dZ4%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">得出预测线后,<span style="color: black;">咱们</span>就<span style="color: black;">能够</span>据此来预测<span style="color: black;">将来</span>日子里,<span style="color: black;">区别</span>气温下会有多少游客量,<span style="color: black;">帮忙</span>预测明年在<span style="color: black;">区别</span>季节时,提前准备承载游客量的应对<span style="color: black;">方法</span>,从而<span style="color: black;">帮忙</span>度假村<span style="color: black;">加强</span>整体运营效益。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>回想一下,图中的折线是<span style="color: black;">怎样</span>画出来的?<span style="color: black;">亦</span><span style="color: black;">便是</span>说,计算机是<span style="color: black;">怎样</span><span style="color: black;">晓得</span>这条折线<span style="color: black;">能够</span>最佳拟合游客人数和气温之间的关系呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这<span style="color: black;">便是</span>线性回归在<span style="color: black;">背面</span>起到的关键<span style="color: black;">功效</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">刚<span style="color: black;">起始</span>,计算机画一条随机的直线, 这条直线大概率<span style="color: black;">便是</span>不准的。<span style="color: black;">因此</span>计算机就需要计算这条直线和<span style="color: black;">每一个</span>数据点之间的距离, <span style="color: black;">所有</span>加起来, 量化直线上的数据和真实数据之间的差距。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下一步,已知差距就要减少差距,线性回归的<span style="color: black;">目的</span>是<span style="color: black;">调节</span>直线, 使误差尽可能小, <span style="color: black;">咱们</span><span style="color: black;">经过</span>历史数据训练它,<span style="color: black;">期盼</span>这条线符合训练数据。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">最后,<span style="color: black;">经过</span>数据训练后,得出的直线被<span style="color: black;">叫作</span>为最佳拟合线, <span style="color: black;">咱们</span><span style="color: black;">能够</span>用这条直线, 预测在任何温度下都会有多少游客<span style="color: black;">显现</span>。于是,你就看到计算机生成出了一条符合游客人数和气温之间关系的直线图了。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/9b7aa14d1d447cc8af8f7c50e67c2050~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=OdVX%2BmQJuWXogYLkDvEg4%2Boa9d0%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在现实中,数据关系<span style="color: black;">常常</span><span style="color: black;">无</span><span style="color: black;">那样</span>简单,游客的人数并不是只和气温<span style="color: black;">相关</span>,为了预测更准确的结果, <span style="color: black;">咱们</span>可能需要<span style="color: black;">思虑</span>两个以上的特性。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">例如</span>说, 加上节假日特征后,可视化图表会从2D图变成3D图,,<span style="color: black;">咱们</span>的最佳拟合线更像是一个最佳拟合平面。<span style="color: black;">倘若</span><span style="color: black;">咱们</span>再<span style="color: black;">增多</span>第四个特性, <span style="color: black;">例如</span><span style="color: black;">是不是</span>下雨, <span style="color: black;">那样</span>预测模型的图表将会变得更加<span style="color: black;">繁杂</span>,那就难以直观可视化呈现清楚了。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/a01732f6820c1801a3f2dd1b60f863af~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=qYKGm6zV8x9MlWERI4ENCuSRzxY%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,当<span style="color: black;">咱们</span><span style="color: black;">思虑</span><span style="color: black;">更加多</span>的特性时,需要在图中添加<span style="color: black;">更加多</span>的维度,优化问题会变得更<span style="color: black;">繁杂</span>,拟合训练数据变得更加困难。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此时</span>候,<span style="color: black;">便是</span>神经网络派上用场的<span style="color: black;">地区</span>了,<span style="color: black;">经过</span>将许多简单神经元和权重连接在<span style="color: black;">一块</span>,神经网络<span style="color: black;">能够</span>学习<span style="color: black;">处理</span><span style="color: black;">繁杂</span>的问题,最佳拟合线变<span style="color: black;">成为了</span>一个奇怪的多维函数。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">现实中,当<span style="color: black;">咱们</span>面临<span style="color: black;">繁杂</span>预测时,人工智能<span style="color: black;">常常</span>比普通人发挥得更好。<span style="color: black;">例如</span>,预测天气。</p>
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">3、</span>用损失函数来<span style="color: black;">暗示</span>误差</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">认识</span>了训练数据的优化策略后,不如<span style="color: black;">咱们</span>再好奇一点,进一步追问下去,计算机是<span style="color: black;">怎样</span><span style="color: black;">晓得</span>自己预测的数据和<span style="color: black;">实质</span>数据有差距呢?<span style="color: black;">晓得</span>差距后又是<span style="color: black;">怎样</span>减少差距,让输出的预测结果和<span style="color: black;">实质</span>结果最符合呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">预测值和<span style="color: black;">实质</span>值之间的差距<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">叫作</span>作误差,计算机<span style="color: black;">想要</span><span style="color: black;">晓得</span>预测值与<span style="color: black;">实质</span>值之间<span style="color: black;">是不是</span>产生误差,还<span style="color: black;">晓得</span>误差有多大,就需要损失函数派上用场了。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经网络中的损失函数是一种衡量模型预测结果与<span style="color: black;">实质</span>结果之间差距的<span style="color: black;">办法</span>。在训练神经网络时,<span style="color: black;">咱们</span>的<span style="color: black;">目的</span>是最小化损失函数以使模型更好地拟合数据,从而实现更准确的预期结果。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">平常</span>的损失函数有均方误差(MSE)、绝对值误差(MAE)、交叉熵损失(Cross-Entropy Loss)、Hinge损失(Hinge Loss)、对数损失(Log Loss)、Huber损失(Huber Loss)、平均绝对误差(Mean Absolute Error,简<span style="color: black;">叫作</span>MAE)等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这些损失函数在<span style="color: black;">区别</span>场景下有各自的<span style="color: black;">优良</span>和适用性,<span style="color: black;">选取</span>合适的损失函数<span style="color: black;">针对</span><span style="color: black;">加强</span>模型的性能至关重要。在<span style="color: black;">实质</span>应用中,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">按照</span>数据的特点和任务<span style="color: black;">需要</span>来<span style="color: black;">选取</span>合适的损失函数。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/776aa77860e3cec138aa7d966aedd6de~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=KqdcbXLe1HTzMm1MGn5gWutV1as%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以均方误差(MSE)为例,均方误差是预测值与真实值之间差值的平方和的平均值。<span style="color: black;">详细</span><span style="color: black;">来讲</span>,<span style="color: black;">倘若</span><span style="color: black;">咱们</span>有n个预测值和对应的<span style="color: black;">实质</span>值,MSE的计算公式<span style="color: black;">便是</span>:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">MSE = (1/n) * Σ(yi – ŷi)^2</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">其中,y_i<span style="color: black;">暗示</span><span style="color: black;">实质</span>值,ŷ_i<span style="color: black;">暗示</span>预测值,n<span style="color: black;">暗示</span>样本数量,Σ<span style="color: black;">暗示</span>求和。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/a29a306a6e71e4c836679c7a21751082~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=bzg7TquS%2BN9Sx%2FBzMSb88S1qxeY%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在均方误差(MSE)的结果中,MSE越小,模型拟合效果越好,说明预测模型的准确性越高。相反,<span style="color: black;">倘若</span>MSE的值<span style="color: black;">很强</span>,<span style="color: black;">那样</span>预测模型的准确性就相对较低。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此呢</span>,在<span style="color: black;">实质</span>应用中,<span style="color: black;">咱们</span><span style="color: black;">一般</span><span style="color: black;">期盼</span>MSE的值尽可能小,以<span style="color: black;">得到</span>更好的预测效果。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">任何一个模型都有其适用的边界,均方误差<span style="color: black;">亦</span>不例外。均方误差(MSE)适用于连续型数据,尤其是回归问题。既然<span style="color: black;">晓得</span>均方误差在回归问题上比较有效,<span style="color: black;">咱们</span><span style="color: black;">亦</span>有必要先对回归问题有个大概的<span style="color: black;">认识</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在统计学和<span style="color: black;">设备</span>学习<span style="color: black;">行业</span>中,回归问题常用于预测一个连续变量的值基于其他<span style="color: black;">关联</span>变量的影响,<span style="color: black;">创立</span>一个模型,<span style="color: black;">经过</span>分析已知的自变量和因变量的数据,来理解它们之间的关系。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文第二段“以线性回归为例的训练优化策略”中<span style="color: black;">说到</span>的线性回归指的<span style="color: black;">便是</span>自变量和因变量之间存在线性关系的<span style="color: black;">状况</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">回归问题在现实生活中有着广泛的应用,如预测房价,预测股票价格,又<span style="color: black;">或</span>仅仅预测度假村游客人数和气温高低的关系等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">经过</span>对<span style="color: black;">海量</span>历史数据的分析和建模,<span style="color: black;">咱们</span><span style="color: black;">能够</span>为这些<span style="color: black;">实质</span>问题<span style="color: black;">供给</span>有价值的预测结果。当然,前提是数据的质量是<span style="color: black;">优秀</span>的,模型的<span style="color: black;">选取</span>是匹配的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">综上所述,<span style="color: black;">咱们</span><span style="color: black;">经过</span>损失函数来<span style="color: black;">暗示</span>模型预测的误差,以均方误差为例,MSE用于<span style="color: black;">暗示</span>某个线性回归模型预测的准确率。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">接第二段中度假村的例子,<span style="color: black;">倘若</span>首次MSE的值为10,<span style="color: black;">经过</span>多次<span style="color: black;">调节</span>后,最后一次MSE的值为0.1,MSE从10降到了1,则说明<span style="color: black;">调节</span>后的预测模型变得更准确了。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/76dd2b469e831dad60a6ab04ed2a3a54~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=0b5G09ghhZ2Bb4FIHZFZt0gONgE%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">然而,<span style="color: black;">咱们</span><span style="color: black;">不可</span>仅从MSE的值来决定一个模型的好坏。这是<span style="color: black;">由于</span>,在<span style="color: black;">区别</span>的应用场景中,<span style="color: black;">咱们</span><span style="color: black;">针对</span>模型的预测精度<span style="color: black;">需求</span>是<span style="color: black;">区别</span>的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">例如,在某些对预测精度<span style="color: black;">需求</span>极高的场景中,即使MSE的值<span style="color: black;">仅有</span>0.01,<span style="color: black;">咱们</span><span style="color: black;">亦</span>可能认为这个模型的效果<span style="color: black;">欠好</span>,而在<span style="color: black;">有些</span>对预测精度<span style="color: black;">需求</span>较低的场景中,即使MSE的值达到了0.1,<span style="color: black;">咱们</span><span style="color: black;">亦</span>可能认为这个模型的效果<span style="color: black;">已然</span>足够好。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">值得<span style="color: black;">重视</span>的是:即使是标准化的AI模型,在<span style="color: black;">实质</span>运用中,<span style="color: black;">亦</span>需要<span style="color: black;">详细</span>问题<span style="color: black;">详细</span>分析,切不可无脑照搬,采用什么模型,首要的<span style="color: black;">便是</span>先清楚待<span style="color: black;">处理</span>的问题是什么,只用清楚了问题的本质<span style="color: black;">才可</span>找对适合的模型,这节奏,是不是有点拿着AI<span style="color: black;">方法</span>进行私人订制那味儿了?</p>
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">4、</span>用反向传播来减少误差</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">上段说到,损失函数<span style="color: black;">能够</span>优化AI模型预测的准确性,这话不全对。<span style="color: black;">由于</span>,仅仅是损失函数,只是起到了一半的<span style="color: black;">功效</span>,需要完成<span style="color: black;">另一</span>一半,才<span style="color: black;">能够</span>真正达成模型的训练调优。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这<span style="color: black;">另一</span>一半,<span style="color: black;">便是</span>反向传播(Back Propagation),<span style="color: black;">亦</span>被<span style="color: black;">叫作</span>为反向训练或反向学习,是一种重要的<span style="color: black;">设备</span>学习算法。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它的核心思想是<span style="color: black;">经过</span>计算网络的输出误差并将其反向传播到神经网络之前的每一层,从而更新原神经网络中的权重和偏置,以使得神经网络的预测结果更接近于真实的<span style="color: black;">目的</span>值。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">正如<span style="color: black;">咱们</span>前几篇<span style="color: black;">文案</span>中所<span style="color: black;">认识</span>到的,在神经网络中,每一层的神经元都会对输入数据进行一系列的处理和变换,<span style="color: black;">而后</span>将处理后的结果传递给下一层。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个过程<span style="color: black;">能够</span>被视为一个信息的传递过程,而在这个过程中,网络的权重和偏置起着关键的<span style="color: black;">功效</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">然而,<span style="color: black;">因为</span>神经网络的<span style="color: black;">繁杂</span>性,<span style="color: black;">咱们</span>很难直接<span style="color: black;">经过</span>数学公式计算出神经网络的最优权重和偏置。<span style="color: black;">因此呢</span>,<span style="color: black;">咱们</span>需要<span style="color: black;">运用</span>一种迭代的<span style="color: black;">办法</span>来逐步优化这些参数,这<span style="color: black;">便是</span>反向传播算法的思想起源。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>说,为了训练优化神经网络,在损失函数得出误差值后,反向传播算法会将结果反馈给神经网络前几层的神经元并促其<span style="color: black;">调节</span>,<span style="color: black;">有些</span>神经元的计算可能比其他神经元的计算<span style="color: black;">更易</span><span style="color: black;">导致</span>错误,,权重会<span style="color: black;">调节</span>得多<span style="color: black;">有些</span>,错误少的就<span style="color: black;">调节</span>得少<span style="color: black;">有些</span>,层层几次反馈和<span style="color: black;">调节</span>后,就<span style="color: black;">能够</span>让计算机得出比之前更准确的预测结果,神经网络模型<span style="color: black;">亦</span><span style="color: black;">因此呢</span>得到训练和优化。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/5871ac08e1865262c833203b0d6af5a7~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=k2RNp3P3a46mVeg7AsVLtC7SAFI%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以上,<span style="color: black;">便是</span>反向传播工作的基本原理了。不如,<span style="color: black;">咱们</span>再往下追问一步,反向传播算法是<span style="color: black;">怎样</span>改变原神经网络的权重和偏置呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>已知,反向传播的基本思想是从输出层<span style="color: black;">起始</span>,逐层向前计算<span style="color: black;">每一个</span>神经元对损失函数的负贡献(即梯度),这其中的“梯度”,便<span style="color: black;">能够</span>更新神经网络的权重和偏置,从而<span style="color: black;">得到</span>较低的损失函数值。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,<span style="color: black;">咱们</span>还需要弄清楚两个问题:1.梯度是什么?2.梯度是<span style="color: black;">怎样</span>更新权重和偏置的?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">简而言之,梯度<span style="color: black;">便是</span>一个函数在某一点上的斜率或变化率。更<span style="color: black;">详细</span>地说,它<span style="color: black;">暗示</span>的是函数输出值关于输入值的变化<span style="color: black;">状况</span>。这个梯度告诉<span style="color: black;">咱们</span>,<span style="color: black;">倘若</span><span style="color: black;">咱们</span>想减小损失函数的值,应该<span style="color: black;">怎样</span><span style="color: black;">调节</span>网络的权重。<span style="color: black;">因此</span>,<span style="color: black;">咱们</span>需要先计算梯度,再更新网络的权重。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在反向传播算法中,梯度的计算分为前向传播和反向传播两个<span style="color: black;">周期</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在前向传播<span style="color: black;">周期</span>,网络<span style="color: black;">首要</span>将输入数据传递到输出层,<span style="color: black;">而后</span>逐层向前计算每一层的输出和损失函数的值。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在这个过程中,<span style="color: black;">每一个</span>神经元都会<span style="color: black;">按照</span>其前一层的输出和激活函数来计算自己的输出,并将这个输出传递给下一层。<span style="color: black;">同期</span>,<span style="color: black;">每一个</span>神经元还会计算其输入与输出之间的误差,这个误差会随着数据在网络中的传播而被累积起来。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/bc1fd0928bfb056ccdffdc4e69d7ec33~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=QYPvZQGrLyddM0TcyBLMk6CyJ3U%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在前向传播完成后,反向传播<span style="color: black;">周期</span><span style="color: black;">起始</span>计算梯度。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">从输出层<span style="color: black;">起始</span>,<span style="color: black;">每一个</span>神经元都会<span style="color: black;">按照</span>其输出误差和激活函数的导数来计算其在反向传播过程中对损失函数的贡献。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">而后</span>,这些梯度信息会逐层向后传播,直到传回输入层。<span style="color: black;">这般</span>,<span style="color: black;">咱们</span>就<span style="color: black;">能够</span>得到<span style="color: black;">每一个</span>参数<span style="color: black;">针对</span>损失函数的贡献,即参数的梯度。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了计算梯度,<span style="color: black;">咱们</span>需要用到链式法则(Chain Rule)。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">链式法则是微积分中的一个基本法则,它描述了复合函数的导数是<span style="color: black;">怎样</span>分解为简单函数的导数之积的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在反向传播中,<span style="color: black;">咱们</span><span style="color: black;">能够</span>将<span style="color: black;">全部</span>神经网络看作是一个复合函数,其中<span style="color: black;">每一个</span>神经元都是一个简单函数。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">经过</span>链式法则,<span style="color: black;">咱们</span><span style="color: black;">能够</span>计算出损失函数关于<span style="color: black;">每一个</span>权重的偏导数(即梯度),<span style="color: black;">而后</span>用这些梯度去更新网络的权重。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">得出了梯度后,计算机又是<span style="color: black;">怎样</span>借助梯度来更新权重和偏置的呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">俗话说,用魔法打败魔法,算法应对算法,<span style="color: black;">因此</span><span style="color: black;">咱们</span>需要借助<span style="color: black;">有些</span>优化算法来更新梯度,从而实现权重和偏置的有效优化。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">平常</span>的优化算法有梯度下降法、随机梯度下降法(SGD)、Adam这三种。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以梯度下降法为例,展开说一下其实现原理。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">梯度下降法是一种在<span style="color: black;">设备</span>学习和深度学习中常用的优化算法。它的核心思想是沿着<span style="color: black;">目的</span>函数的梯度负方向进行迭代,从而找到使<span style="color: black;">目的</span>函数取得最小值的点。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了形象地解释这一过程,<span style="color: black;">咱们</span><span style="color: black;">能够</span>将其比喻为一个登山者在攀登一座陡峭的山峰。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">假设这座山峰<span style="color: black;">便是</span><span style="color: black;">咱们</span>的<span style="color: black;">目的</span>函数,<span style="color: black;">咱们</span><span style="color: black;">期盼</span>找到一个最低的位置(即<span style="color: black;">目的</span>函数的最小值)。然而,这座山是如此陡峭,以至于<span style="color: black;">咱们</span><span style="color: black;">没法</span>一眼就看到最低点在哪里。<span style="color: black;">因此呢</span>,<span style="color: black;">咱们</span>需要借助<span style="color: black;">有些</span>工具来<span style="color: black;">帮忙</span><span style="color: black;">咱们</span>找到这个位置。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">最<span style="color: black;">起始</span>,<span style="color: black;">咱们</span>需要确定一个初始位置,这个初始位置<span style="color: black;">能够</span>是一个随机<span style="color: black;">选取</span>的值,<span style="color: black;">亦</span><span style="color: black;">能够</span>是之前的迭代结果。<span style="color: black;">而后</span>,<span style="color: black;">咱们</span>需要<span style="color: black;">起始</span>攀登。在每一步攀登中,<span style="color: black;">咱们</span>都会<span style="color: black;">测绘</span>当前的海拔高度,这<span style="color: black;">便是</span><span style="color: black;">咱们</span>计算<span style="color: black;">目的</span>函数值的过程。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">接下来,<span style="color: black;">咱们</span>需要判断当前的位置<span style="color: black;">是不是</span><span style="color: black;">已然</span>足够接近最低点。为了实现这一点,<span style="color: black;">咱们</span>需要观察并<span style="color: black;">测绘</span>当前位置<span style="color: black;">周边</span>的地形变化。在这座山的脚下到最高点之间,地形变化是<span style="color: black;">逐步</span>减小的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span><span style="color: black;">能够</span>将这种地形变化<span style="color: black;">叫作</span>为梯度。梯度的方向<span style="color: black;">便是</span>山坡最陡峭的<span style="color: black;">地区</span>,<span style="color: black;">亦</span><span style="color: black;">便是</span><span style="color: black;">咱们</span>下一步需要前进的方向。<span style="color: black;">经过</span><span style="color: black;">持续</span>地<span style="color: black;">测绘</span>梯度并朝相反的方向前进,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">逐步</span>降低海拔高度,从而更接近最低点。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在爬山过程中,<span style="color: black;">咱们</span>还需要<span style="color: black;">思虑</span>一个重要的<span style="color: black;">原因</span>:步长。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">步长过大可能<span style="color: black;">引起</span><span style="color: black;">咱们</span>跳过最低点,步长过小则可能<span style="color: black;">引起</span><span style="color: black;">咱们</span>陷入局部最低点而<span style="color: black;">没法</span>到达全局最低点。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此呢</span>,在梯度下降法中,<span style="color: black;">咱们</span>需要<span style="color: black;">按照</span><span style="color: black;">实质</span><span style="color: black;">状况</span><span style="color: black;">调节</span>步长<span style="color: black;">体积</span>,以便更快地找到<span style="color: black;">目的</span>函数的最小值。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以登山为例,梯度下降法就像是一场寻找最低点的攀登之旅。<span style="color: black;">经过</span><span style="color: black;">测绘</span>梯度并沿着梯度的负方向前进,<span style="color: black;">咱们</span><span style="color: black;">能够</span>逐步降低<span style="color: black;">目的</span>函数值,<span style="color: black;">最后</span>找到全局最优解。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">此刻,<span style="color: black;">咱们</span>再来试着回答这个问题:梯度是<span style="color: black;">怎样</span>更新权重和偏置的?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span><span style="color: black;">能够</span>先定义一个损失函数,这个函数用于衡量神经网络预测结果与真实结果之间的差距,就像刚<span style="color: black;">起始</span>找山峰的初始点。<span style="color: black;">而后</span>,<span style="color: black;">咱们</span><span style="color: black;">经过</span>反向传播算法计算出损失函数对<span style="color: black;">每一个</span>权重和偏置的梯度。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">接下来,需要设定一个学习率,这个学习率决定了<span style="color: black;">咱们</span>每次更新参数时移动的步长。<span style="color: black;">通常</span><span style="color: black;">来讲</span>,学习率<span style="color: black;">不可</span>设置得太大,否则可能会<span style="color: black;">引起</span>算法在最小值点<span style="color: black;">周边</span>震荡不前;<span style="color: black;">亦</span><span style="color: black;">不可</span>设置得太小,否则算法收敛速度会非常慢。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">最后,<span style="color: black;">咱们</span>就<span style="color: black;">能够</span><span style="color: black;">按照</span>计算出的梯度和学习率来更新神经网络的权重和偏置了。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">详细</span><span style="color: black;">来讲</span>,<span style="color: black;">针对</span><span style="color: black;">每一个</span>权重和偏置,<span style="color: black;">咱们</span>将其当前值减去学习率乘以对应的梯度,得到新的值。<span style="color: black;">这般</span>,<span style="color: black;">经过</span>多次迭代,<span style="color: black;">咱们</span>就能逐步找到使损失函数最小的参数值。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/7f94b7b6cff8d592729be58f62a62c90~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=j1PfbyPLcUHJLzW%2BDQCpmXYNeT8%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在这一系列的过程中,梯度便实现了对神经网络权重和偏置的优化。而反向传播算法<span style="color: black;">亦</span>因借助梯度的<span style="color: black;">帮忙</span>,减少了神经网络模型对预测结果的误差。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">最后</span>,<span style="color: black;">咱们</span>从表象结果看来,AI的模型经过训练优化后,预测的准确率变得越来越高。</p>
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">5、</span>神经网络的数据拟合问题</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">有时, 反向传播在使神经网络适合于某些数据方面做得太好了, 在大数据集中产生了<span style="color: black;">非常多</span>巧合的关系,这些关系可能并不是真实世界中的因果关系,而是<span style="color: black;">因为</span>数据集的特点<span style="color: black;">或</span>训练过程中的随机性所<span style="color: black;">引起</span>的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">例如</span>,“香蕉和火灾”。<span style="color: black;">按照</span>数据<span style="color: black;">表示</span>,当香蕉价格上涨时,火灾的<span style="color: black;">出现</span>率<span style="color: black;">亦</span>会随之<span style="color: black;">提升</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">然而,这并不<span style="color: black;">寓意</span>着香蕉和火灾之间存在因果关系。<span style="color: black;">实质</span>上,这两个事件之间并<span style="color: black;">无</span>必然的联系。这<span style="color: black;">便是</span>一个典型的大数据中无因果关系<span style="color: black;">然则</span>数据<span style="color: black;">表示</span><span style="color: black;">相关</span>系的巧合例子。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,即使<span style="color: black;">咱们</span>训练出了AI模型,但结果并不<span style="color: black;">必定</span>如你所愿,搞<span style="color: black;">欠好</span>还会闹出笑话,<span style="color: black;">咱们</span>还需要关注AI中的数据拟合问题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">数据拟合问题<span style="color: black;">能够</span>分为过拟合与欠拟合,<span style="color: black;">每一个</span>问题的<span style="color: black;">出现</span><span style="color: black;">背面</span>都有着<span style="color: black;">区别</span>的<span style="color: black;">原由</span>,<span style="color: black;">亦</span>需要<span style="color: black;">区别</span>的<span style="color: black;">处理</span><span style="color: black;">办法</span>。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/3fb9708c389ca3607bccba3eb1b1bac9~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=wSWD5ibOl3mON3N9KNdHLCyWcSI%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当然,关于数据拟合问题<span style="color: black;">亦</span><span style="color: black;">能够</span>有其他<span style="color: black;">区别</span>的<span style="color: black;">归类</span>,本文<span style="color: black;">重点</span>还是就过拟合与欠拟合展开介绍。</p>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;">1. 过拟合(Overfitting)</h2>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">过拟合<span style="color: black;">指的是</span>模型在训练数据上表现得非常好,<span style="color: black;">然则</span>在新的、未见过的数据上表现<span style="color: black;">不良</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这<span style="color: black;">一般</span>是<span style="color: black;">由于</span>模型过于<span style="color: black;">繁杂</span>,学习到了训练数据中的噪声和不具<span style="color: black;">表率</span>性的特征,过于依赖训练数据中的细节,忽略了数据的<span style="color: black;">通常</span>规律。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了更好理解过拟合问题在<span style="color: black;">实质</span>应用中的影响,假设<span style="color: black;">咱们</span>用一个数学模型来预测学生的成绩。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在数据训练中,<span style="color: black;">咱们</span><span style="color: black;">能够</span>从历史数据中<span style="color: black;">发掘</span>,学生的身高和成绩之间存在<span style="color: black;">必定</span>的正<span style="color: black;">关联</span>关系。于是<span style="color: black;">咱们</span>训练了一个简单的线性回归模型,将身高<span style="color: black;">做为</span>自变量,成绩<span style="color: black;">做为</span>因变量。经过训练,<span style="color: black;">咱们</span><span style="color: black;">发掘</span>这个模型在训练集上的表现非常出色,预测成绩与<span style="color: black;">实质</span>成绩高度一致。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">但有基本常识的<span style="color: black;">咱们</span>即使不预测数据都会<span style="color: black;">晓得</span>,学生的成绩和身高之间并不会产生直接的<span style="color: black;">关联</span>关系。<span style="color: black;">因此</span>,当<span style="color: black;">咱们</span>将这个模型应用到新的学生数据上时,会<span style="color: black;">发掘</span>预测的准确性大幅下降,<span style="color: black;">乃至</span>可能<span style="color: black;">显现</span>完全错误的预测。</p><img src="https://p26-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/9d65bf9801f4b4fdb378a8c3a565d403~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=f1aPgrZsMSOVcTYBISlKro4fuOo%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在这个例子中,<span style="color: black;">咱们</span>的线性回归模型可能过于<span style="color: black;">繁杂</span>,过分强调了身高对学生成绩的影响,而忽略了其他潜在的影响<span style="color: black;">原因</span>,如学习态度、<span style="color: black;">奋斗</span>程度等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此呢</span>,当面对新的学生数据时,<span style="color: black;">因为</span>这些数据中可能<span style="color: black;">包括</span>与训练数据<span style="color: black;">区别</span>的特征分布,模型的预测性能就大打折扣。<span style="color: black;">因此</span>,<span style="color: black;">咱们</span>在数据训练的过程中,需要识别数据<span style="color: black;">是不是</span>过拟合,来避免后续问题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了识别过拟合现象,<span style="color: black;">咱们</span><span style="color: black;">一般</span>会将数据集分为训练集、验证集和测试集。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">训练集用于训练模型,验证集用于<span style="color: black;">调节</span>模型参数以<span style="color: black;">得到</span>最佳的性能,而测试集则用于<span style="color: black;">评定</span>模型在未知数据上的表现。<span style="color: black;">经过</span>对比模型在这三个数据集上的表现,<span style="color: black;">咱们</span><span style="color: black;">能够</span>判断模型<span style="color: black;">是不是</span>存在过拟合问题。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/b344bcbd51d294f920ea6654e1c6665d~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=xNMgP24d1f5gmC0wbKKwil2YoPk%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span>,<span style="color: black;">显现</span>了过拟合问题时,<span style="color: black;">咱们</span>该<span style="color: black;">怎样</span><span style="color: black;">处理</span>呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为<span style="color: black;">认识</span>决过拟合问题,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">增多</span>数据量、简化模型、正则化或交叉验证等<span style="color: black;">办法</span>来<span style="color: black;">处理</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【<span style="color: black;">增多</span>数据量】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">顾名思义<span style="color: black;">便是</span>引入<span style="color: black;">更加多</span>的数据,<span style="color: black;">帮忙</span>模型更好地<span style="color: black;">捉捕</span>到潜在的模式,从而减少过拟合的<span style="color: black;">危害</span>。然而,在<span style="color: black;">实质</span>应用中,获取<span style="color: black;">海量</span>高质量数据可能会有<span style="color: black;">有些</span>不现实。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【简化模型】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">便是</span><span style="color: black;">选取</span>较少的参数<span style="color: black;">或</span>较简单的模型结构来减小模型<span style="color: black;">繁杂</span>度,例如减少神经网络中的<span style="color: black;">隐匿</span>层的数量或节点数。这个办法<span style="color: black;">能够</span>降低模型对训练数据的依赖,从而减少过拟合的<span style="color: black;">危害</span>。<span style="color: black;">然则</span>,过于简化的模型可能会损失<span style="color: black;">有些</span>有用的信息,影响模型的性能。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【正则化】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">正则化是<span style="color: black;">经过</span>向模型的损失函数添加额外的项,来限制模型参数的<span style="color: black;">体积</span>,防止其过度膨胀。常用的正则化技术<span style="color: black;">包含</span>L1正则化和L2正则化。L1正则化倾向于使<span style="color: black;">有些</span>参数变为零,从而实现特征<span style="color: black;">选取</span>。而L2正则化<span style="color: black;">经过</span><span style="color: black;">处罚</span>参数的平方值,使得参数变得更为均匀。正则化<span style="color: black;">能够</span><span style="color: black;">帮忙</span><span style="color: black;">咱们</span>在保持模型性能的<span style="color: black;">同期</span>,降低过拟合的<span style="color: black;">危害</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【交叉验证】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">交叉验证是一种<span style="color: black;">评定</span>模型泛化能力的有效<span style="color: black;">办法</span>。它将数据集划分为多个子集,<span style="color: black;">而后</span><span style="color: black;">运用</span><span style="color: black;">区别</span>的子集进行训练和验证,最后将各个子集的结果综合起来得到<span style="color: black;">最后</span>的<span style="color: black;">评定</span>指标。交叉验证<span style="color: black;">能够</span><span style="color: black;">帮忙</span><span style="color: black;">咱们</span><span style="color: black;">发掘</span>过拟合问题,并<span style="color: black;">选取</span>合适的模型参数。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/b344bcbd51d294f920ea6654e1c6665d~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=xNMgP24d1f5gmC0wbKKwil2YoPk%3D" style="width: 50%; margin-bottom: 20px;">
    <h2 style="color: black; text-align: left; margin-bottom: 10px;">2.欠拟合(Underfitting)</h2>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合<span style="color: black;">指的是</span>神经网络在训练数据和新数据上都表现<span style="color: black;">不良</span>的现象。这<span style="color: black;">一般</span>是<span style="color: black;">由于</span>模型过于简单,<span style="color: black;">没法</span><span style="color: black;">捉捕</span>到数据中的关键特征和规律。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">例如,<span style="color: black;">倘若</span><span style="color: black;">咱们</span><span style="color: black;">运用</span>一个<span style="color: black;">仅有</span>一层的神经网络来拟合<span style="color: black;">繁杂</span>的非线性关系,<span style="color: black;">那样</span>模型很可能<span style="color: black;">没法</span>准确地<span style="color: black;">捉捕</span>到数据中的模式,<span style="color: black;">引起</span>训练和测试效果都<span style="color: black;">不睬</span>想。就像一个小学生去解大学微积分的题目,大概率是给不出正确答案的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>继续以预测学生成绩为例,来<span style="color: black;">详细</span>解释一下欠拟合现象。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">假设<span style="color: black;">咱们</span>有一份学生的成绩数据集,<span style="color: black;">然则</span>这次<span style="color: black;">咱们</span>的模型过于简单,只<span style="color: black;">思虑</span>了学习时间,而<span style="color: black;">无</span><span style="color: black;">思虑</span>其他可能影响成绩的<span style="color: black;">原因</span>,例如学生的先前知识水平、家庭背景、课程难度、考试形式等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span><span style="color: black;">咱们</span>的模型就可能会<span style="color: black;">显现</span>数据欠拟合的问题,<span style="color: black;">那样</span><span style="color: black;">咱们</span>就<span style="color: black;">没法</span>仅仅<span style="color: black;">经过</span>学习时间,来准确预测学生成绩。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/352b3af3a26d6f997f27b6c87e222aad~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=cF0ZnppuJwIJv31pzEDlDJoVErA%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>在数据训练的过程中,又该<span style="color: black;">怎样</span>识别数据欠拟合?其实,欠拟合的<span style="color: black;">重点</span>表现<span style="color: black;">包含</span>高偏差和低方差。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【高偏差】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合模型的预测结果与真实值之间存在<span style="color: black;">很强</span>的差距,即模型<span style="color: black;">没法</span>准确地估计出数据的均值。这<span style="color: black;">一般</span>是<span style="color: black;">因为</span>模型过于简单,<span style="color: black;">没法</span><span style="color: black;">捉捕</span>到数据中的<span style="color: black;">繁杂</span>关系所<span style="color: black;">引起</span>的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">例如,在回归问题中,<span style="color: black;">倘若</span>采用线性回归模型来处理非线性关系的数据,<span style="color: black;">那样</span>模型就<span style="color: black;">没法</span>准确地描述这种关系,从而<span style="color: black;">引起</span>预测结果偏离<span style="color: black;">实质</span>值。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【低方差】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合模型对训练数据的误差较小,但在测试数据上的误差<span style="color: black;">很强</span>。这是<span style="color: black;">由于</span>欠拟合模型过于简单,<span style="color: black;">不可</span>很好地泛化到新的数据上。换句话说,虽然欠拟合模型在训练数据上的表现不错,但在未知数据上可能表现得非常糟糕。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>再深挖一点,<span style="color: black;">为何</span>会<span style="color: black;">显现</span>欠拟合问题?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合问题产生的<span style="color: black;">原由</span><span style="color: black;">亦</span>有多种,<span style="color: black;">一般</span><span style="color: black;">出现</span>在以下<span style="color: black;">状况</span>:</p><strong style="color: blue;">模型<span style="color: black;">繁杂</span>度不足:</strong><span style="color: black;">运用</span>过于简单的模型,例如线性模型去拟合非线性关系的数据。<strong style="color: blue;">特征不足:</strong>数据中的重要特征未被<span style="color: black;">思虑</span>,<span style="color: black;">引起</span>模型<span style="color: black;">没法</span>准确地预测<span style="color: black;">目的</span>变量。<strong style="color: blue;">训练不足</strong>:模型在训练集上<span style="color: black;">无</span>足够的迭代学习,未能很好地适应数据。<strong style="color: blue;">噪声干扰:</strong>数据中的噪声干扰过大,模型过于<span style="color: black;">敏锐</span>,难以区分真实信号和噪声。<strong style="color: blue;">样本量不足:</strong>训练数据量过小,难以<span style="color: black;">捉捕</span>整体数据分布。<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合是<span style="color: black;">咱们</span>在训练数据时,必须要关注的问题,<span style="color: black;">由于</span>它可能<span style="color: black;">引起</span>模型在<span style="color: black;">实质</span>应用中的性能不佳,到最后让团队之前的<span style="color: black;">奋斗</span>付诸东流。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span>,<span style="color: black;">显现</span>了欠拟合问题时,<span style="color: black;">咱们</span>该<span style="color: black;">怎样</span><span style="color: black;">处理</span>呢?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当<span style="color: black;">咱们</span><span style="color: black;">晓得</span>欠拟合问题的<span style="color: black;">原由</span>之后,<span style="color: black;">处理</span>该问题的关键是<span style="color: black;">增多</span>模型的<span style="color: black;">繁杂</span>性,以便计算机更好地<span style="color: black;">捉捕</span>数据中的关系和特征。<span style="color: black;">同期</span>,还需要<span style="color: black;">重视</span>避免过拟合,<span style="color: black;">以避免</span>过度<span style="color: black;">繁杂</span><span style="color: black;">引起</span>泛化性能下降。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为<span style="color: black;">认识</span>决欠拟合问题,<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">经过</span><span style="color: black;">增多</span>模型<span style="color: black;">繁杂</span>度、<span style="color: black;">增多</span>更多的特征、降低正则化参数或<span style="color: black;">增多</span>训练数据等<span style="color: black;">办法</span>来<span style="color: black;">处理</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【<span style="color: black;">增多</span>模型<span style="color: black;">繁杂</span>度】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">倘若</span>模型过于简单,<span style="color: black;">没法</span><span style="color: black;">捉捕</span>数据中的<span style="color: black;">繁杂</span>模式,<span style="color: black;">能够</span><span style="color: black;">思虑</span><span style="color: black;">运用</span>更<span style="color: black;">繁杂</span>的模型,如<span style="color: black;">增多</span><span style="color: black;">更加多</span>的层或节点,引入<span style="color: black;">更加多</span>的特征或改变模型的结构,使其能够更好地<span style="color: black;">捉捕</span>数据中的<span style="color: black;">繁杂</span>关系。例如,<span style="color: black;">能够</span>尝试<span style="color: black;">运用</span>多项式回归、支持向量机等更<span style="color: black;">繁杂</span>的模型来<span style="color: black;">处理</span>非线性问题,<span style="color: black;">或</span>在神经网络中,<span style="color: black;">增多</span><span style="color: black;">隐匿</span>层的数量或节点的数量。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【<span style="color: black;">增多</span><span style="color: black;">更加多</span>的特征】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">经过</span><span style="color: black;">增多</span><span style="color: black;">更加多</span>的特征来使模型变得更加<span style="color: black;">繁杂</span>,从而更好地拟合数据。这些特征<span style="color: black;">能够</span>是现有的特征的线性或非线性组合,<span style="color: black;">亦</span><span style="color: black;">能够</span>是新的、从其他数据源得到的特征。在学生考试成绩的例子中,<span style="color: black;">能够</span><span style="color: black;">思虑</span>加入<span style="color: black;">更加多</span>可能影响成绩的<span style="color: black;">原因</span>,如家庭背景、学生兴趣等。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【降低正则化参数】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">正则化是一种防止过拟合的<span style="color: black;">办法</span>,但在某些<span style="color: black;">状况</span>下,过度的正则化可能<span style="color: black;">引起</span>欠拟合。<span style="color: black;">因此呢</span>,<span style="color: black;">能够</span>适当降低正则化参数,以<span style="color: black;">准许</span>模型更灵活地适应训练数据。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">【<span style="color: black;">增多</span>训练数据】</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">欠拟合<span style="color: black;">一般</span>与训练数据量不足<span style="color: black;">相关</span>。<span style="color: black;">经过</span>收集<span style="color: black;">更加多</span>的训练数据,<span style="color: black;">能够</span><span style="color: black;">加强</span>模型的学习能力和泛化能力,从而减轻欠拟合现象。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/5d07759d7cdab0d19d60987e9c1647ef~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1725628893&amp;x-signature=4x5LPTx0RJBTc%2FufYsgbESw8J7w%3D" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,当<span style="color: black;">咱们</span><span style="color: black;">晓得</span>了<span style="color: black;">怎样</span><span style="color: black;">经过</span>数据来训练神经网络之后,还需要关注在训练过程中<span style="color: black;">显现</span>的数据拟合问题,<span style="color: black;">亦</span><span style="color: black;">能够</span>理解成AI训练中<span style="color: black;">亦</span>需要过程监督吧。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当<span style="color: black;">咱们</span><span style="color: black;">发掘</span>数据过拟合时,需要借助<span style="color: black;">增多</span>数据量、简化模型、正则化或交叉验证等<span style="color: black;">办法</span>来<span style="color: black;">处理</span>。当<span style="color: black;">咱们</span><span style="color: black;">发掘</span>数据欠拟合时,<span style="color: black;">能够</span>借助<span style="color: black;">增多</span>模型<span style="color: black;">繁杂</span>度、<span style="color: black;">增多</span><span style="color: black;">更加多</span>的特征、降低正则化参数或<span style="color: black;">增多</span>训练数据等<span style="color: black;">办法</span>来解决。</p>
    <h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">6、</span>全文总结</h1>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">倘若</span>你看到此处,足以说明你对AI<span style="color: black;">亦</span>有着非<span style="color: black;">通常</span>的兴趣和热情,我<span style="color: black;">这里</span>送上真诚的感谢。<span style="color: black;">倘若</span>你和我<span style="color: black;">同样</span>,<span style="color: black;">亦</span>对AI模型是<span style="color: black;">怎样</span>训练优化的<span style="color: black;">背面</span>原理感兴趣,相信这篇<span style="color: black;">文案</span>会给你带来<span style="color: black;">帮忙</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在最后,我就本文做一个简单的总结,<span style="color: black;">倘若</span>你<span style="color: black;">无</span><span style="color: black;">第1</span>时间<span style="color: black;">所有</span>理解,<span style="color: black;">按照</span>总结<span style="color: black;">亦</span><span style="color: black;">能够</span>带走<span style="color: black;">有些</span>收获。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经网络是AI的核心,其真正发挥<span style="color: black;">功效</span>之前需要经过充分的训练。本文讨论了对神经网络的训练过程及<span style="color: black;">关联</span>优化策略,并深入探讨神经网络中的数据拟合问题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">与人类学习<span style="color: black;">同样</span>,神经网络需要<span style="color: black;">经过</span><span style="color: black;">海量</span>的数据输入进行学习,以适应特定任务。在训练的过程中,<span style="color: black;">咱们</span>以线性回归为例,<span style="color: black;">经过</span>优化策略来<span style="color: black;">加强</span>模型的性能。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在训练优化过程中,<span style="color: black;">咱们</span><span style="color: black;">运用</span>损失函数来<span style="color: black;">暗示</span>模型的预测与<span style="color: black;">实质</span>结果之间的误差。这个误差越小,模型的性能就越好。<span style="color: black;">经过</span><span style="color: black;">调节</span>模型的参数,<span style="color: black;">咱们</span>试图最小化损失函数,使得模型的预测更加准确。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">损失函数的引入使得<span style="color: black;">咱们</span>能够量化模型的误差,从而为优化<span style="color: black;">供给</span>方向。<span style="color: black;">经过</span>梯度下降等<span style="color: black;">办法</span>,<span style="color: black;">咱们</span><span style="color: black;">能够</span>找到使损失函数最小化的参数值,<span style="color: black;">从而</span><span style="color: black;">加强</span>模型的准确性。这一过程中,反向传播起到了关键作用。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">反向传播<span style="color: black;">经过</span>计算损失函数对模型参数的梯度,实现了误差的反向传递。这<span style="color: black;">寓意</span>着<span style="color: black;">咱们</span><span style="color: black;">能够</span><span style="color: black;">按照</span>误差的方向来更新模型的参数,使得模型<span style="color: black;">逐步</span>趋向最优。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">然而,即使经过精心的训练,神经网络在处理数据时仍然可能面临拟合问题。数据拟合问题表现为过拟合和欠拟合,面对<span style="color: black;">区别</span>的问题,<span style="color: black;">咱们</span><span style="color: black;">亦</span>需要有<span style="color: black;">区别</span>的<span style="color: black;">处理</span><span style="color: black;">办法</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">神经网络的训练过程是一个<span style="color: black;">繁杂</span>而精细的过程,<span style="color: black;">经过</span>本篇,<span style="color: black;">期盼</span>各位看官<span style="color: black;">能够</span>理解和巧妙运用这些概念和<span style="color: black;">办法</span>,<span style="color: black;">亦</span><span style="color: black;">能够</span>更好地利用神经网络来<span style="color: black;">处理</span><span style="color: black;">实质</span>问题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">《孙子·谋攻篇》有云,“知彼知己,百战不殆;不知彼而知己,一胜一负;不知彼不知己,每战必殆。”</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">知是成事的前提。<span style="color: black;">这里</span>引用,不是要把AI当作敌人,而是要知AI,懂AI,而后<span style="color: black;">才可</span>有效和AI共处,在AI的助力下做出更有价值的事情。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>都是浩瀚星河中的一粒,在AI的浪潮中簇拥着前行。AI到底是什么,是<span style="color: black;">咱们</span>必须要弄清楚的课题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文由 @果酿 原创发布于人人都是<span style="color: black;">制品</span>经理,未经作者许可,禁止转载。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">题图来自 Unsplash,基于CC0协议。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">该文观点仅<span style="color: black;">表率</span>作者<span style="color: black;">自己</span>,人人都是<span style="color: black;">制品</span>经理平台仅<span style="color: black;">供给</span>信息存储空间服务。</p>




4zhvml8 发表于 2024-10-10 19:21:53

“沙发”(SF,第一个回帖的人)‌

7wu1wm0 发表于 2024-10-28 23:13:25

祝福你、祝你幸福、早日实现等。
页: [1]
查看完整版本: 怎么样训练优化“AI神经网络”模型?