m5k1umn 发表于 2024-7-9 19:10:45

只抓取网站首页,不收录内页,搜索引擎收录少的处理


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">网站从上线到<span style="color: black;">此刻</span>有<span style="color: black;">一月</span>了,<span style="color: black;">然则</span>百度和360收录<span style="color: black;">始终</span><span style="color: black;">仅有</span>首页,谷歌收录有50,<span style="color: black;">无</span>内页就<span style="color: black;">始终</span>很奇怪,之前<span style="color: black;">始终</span>以为是关键词优化问题,想着才上线跟新估计是<span style="color: black;">这般</span>的。<span style="color: black;">然则</span>后来<span style="color: black;">发掘</span>其他比我上线晚优化<span style="color: black;">通常</span>的网站收录虽然不多,<span style="color: black;">然则</span>会有内页。在百度历史收录记录里面<span style="color: black;">发掘</span>有以前的内页记录,<span style="color: black;">然则</span>是用的<span style="color: black;">第1</span>个默认模版的时候。<span style="color: black;">因此</span>我在想是不是内页屏B了我所有的收录界面,结果一查果然如此。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">处理</span>网站只收录首页,<span style="color: black;">无</span>内页<span style="color: black;">或</span>收录很少的办法有几种<span style="color: black;">办法</span>:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">1、<span style="color: black;">检测</span>网站的robots.txt文件的设置:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">robots是站点与spider沟通的<span style="color: black;">要紧</span><span style="color: black;">途径</span>,站点<span style="color: black;">经过</span>robots文件声明该网站中不想被搜索引擎收录的部分<span style="color: black;">或</span>指定搜索引擎只收录特定的部分。请<span style="color: black;">重视</span>,仅当您的网站<span style="color: black;">包括</span>不<span style="color: black;">期盼</span>被搜索引擎收录的内容时,才<span style="color: black;">必须</span><span style="color: black;">运用</span>robots.txt文件。<span style="color: black;">倘若</span>您<span style="color: black;">期盼</span>搜索引擎收录网站上所有内容,请勿<span style="color: black;">创立</span>robots.txt文件。为了避免站长在设置robots文件时<span style="color: black;">显现</span>,百度站长平台<span style="color: black;">尤其</span>推出了robots<span style="color: black;">工具</span>百度robots<span style="color: black;">工具</span>,<span style="color: black;">帮忙</span>站长正确设置robots。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个东西<span style="color: black;">通常</span>在网站的根目录下面,<span style="color: black;">倘若</span>你和我<span style="color: black;">同样</span><span style="color: black;">日前</span><span style="color: black;">运用</span>的网上套用的模版,大部分不会有这个文件(<span style="color: black;">由于</span>不会自己给你安装到你根目录下),<span style="color: black;">倘若</span><span style="color: black;">发掘</span>有不懂的话<span style="color: black;">能够</span>直接干掉。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">百度只收录首页不收录内页<span style="color: black;">处理</span>办法</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2、<span style="color: black;">检测</span>文件中head部分的声明标签:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">3、下面来<span style="color: black;">仔细</span>介绍下这个&lt;meta name="robots" content=""&gt;申明的内容:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">content中的值决定<span style="color: black;">准许</span>抓取的类型,<span style="color: black;">必要</span><span style="color: black;">同期</span><span style="color: black;">包括</span>两个值:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">是不是</span><span style="color: black;">准许</span>索引(index)和链接(follow,<span style="color: black;">亦</span><span style="color: black;">能够</span>理解为<span style="color: black;">是不是</span><span style="color: black;">准许</span>沿着网页中的超级链接继续抓取)。共有4个参数可选,<span style="color: black;">构成</span>4个组合:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">最后,<span style="color: black;">意见</span><span style="color: black;">大众</span>不要太刻意的在robots.txt中设置<span style="color: black;">太多</span>禁止文件或目录,只设置确实不<span style="color: black;">期盼</span>被搜索引擎索引的目录和文件就<span style="color: black;">能够</span>了。<span style="color: black;">倘若</span>你碰到的问题和我<span style="color: black;">同样</span>,<span style="color: black;">那样</span>你<span style="color: black;">能够</span><span style="color: black;">检测</span>下你的网站目录是不是<span style="color: black;">亦</span>有这个文件,<span style="color: black;">或</span>申明呢?<span style="color: black;">然则</span><span style="color: black;">意见</span>不要轻易禁止抓取,毕竟<span style="color: black;">咱们</span><span style="color: black;">必须</span>的是流量。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">还有一种<span style="color: black;">状况</span><span style="color: black;">便是</span>网站还在考核期,<span style="color: black;">因此</span><span style="color: black;">大众</span>要<span style="color: black;">保持</span>原创,<span style="color: black;">保持</span>外链。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><a style="color: black;"><span style="color: black;">http://www.</span><span style="color: black;">suiningrc.com/</span></a></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><a style="color: black;"><span style="color: black;">h</span></a>ttp://www.<span style="color: black;">sncaipin.com/</span></p>




很甜的橙橙橙子 发表于 2024-8-30 15:35:18

“板凳”(第三个回帖的人)‌

4lqedz 发表于 4 天前

你的话深深触动了我,仿佛说出了我心里的声音。
页: [1]
查看完整版本: 只抓取网站首页,不收录内页,搜索引擎收录少的处理