nykek5i 发表于 前天 11:47

百度推广信息审核三重门:在“降妖除怪”方面的一路升级


    <div style="color: black; text-align: left; margin-bottom: 10px;">
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://p3-sign.toutiaoimg.com/14d00017de8f6cc07ed~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1730133579&amp;x-signature=eKDuinXR49WJkf64fesX6Ye38WA%3D" style="width: 50%; margin-bottom: 20px;"></p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为大规模用户<span style="color: black;">供给</span>的互联网服务,从一<span style="color: black;">起始</span>就要提前<span style="color: black;">思虑</span>的问题是什么呢?答案是反垃圾(anti-spam)。<span style="color: black;">倘若</span>互联网服务不具备反垃圾能力,正常的服务<span style="color: black;">基本</span>开展不下去,在流行起来之后分分钟会被网络垃圾摧毁。这<span style="color: black;">亦</span>是<span style="color: black;">为么</span>美国第七大网站,<span style="color: black;">归类</span>目录鼻祖Craigslist<span style="color: black;">仅有</span>几十个人的团队里,超过三分之二是反垃圾技术人员的<span style="color: black;">原由</span>。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">近期</span>,百度<span style="color: black;">颁布</span>了一组数据来证明<span style="color: black;">自己</span>在信息审核方面的<span style="color: black;">发展</span>与<span style="color: black;">奋斗</span>,披露出来的数字极为惊人。百度<span style="color: black;">日前</span>已屏蔽有害链接38亿条,站点级别已超1亿个。2015年百度的<span style="color: black;">宣传</span>系统已拒绝了不良账户438300个,判罚的违规消费金额达到了4.67亿元,还为公安机关<span style="color: black;">供给</span>了许多造假售假线索。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">百度是世界上流量最大的网站之一,<span style="color: black;">亦</span>是中国大陆流量最大的网站,日搜索请求达60亿次以上。百度用户是最具多样性特征的,用户属性<span style="color: black;">能够</span>说是无所不包,这<span style="color: black;">亦</span>正应了那句话,林子大了什么鸟都有。门类齐全的有害信息,<span style="color: black;">包含</span>违法与有害<span style="color: black;">宣传</span>,<span style="color: black;">皆想</span><span style="color: black;">经过</span>百度这个平台进行传播,<span style="color: black;">倘若</span>百度不具备相应的反垃圾技术和有害信息过滤技术,是<span style="color: black;">基本</span>做不到如今这个规模的。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这世界上所有的搜索引擎,无一例外都会遇到类似问题。谷歌2015年全年共去除了7.8亿条违反其政策的<span style="color: black;">宣传</span>,比2014年的5.24亿条增长了近50%。这个增长率比正常<span style="color: black;">商场</span><span style="color: black;">宣传</span>还快,有数不清的违法<span style="color: black;">宣传</span><span style="color: black;">期盼</span><span style="color: black;">经过</span>搜索引擎谋取利益,不把好关就天下大乱了。百度<span style="color: black;">亦</span><span style="color: black;">同样</span>,<span style="color: black;">每日</span>有4.7亿条<span style="color: black;">宣传</span><span style="color: black;">经过</span>百度<span style="color: black;">宣传</span>系统送审,每秒要处理5000条以上,这基本已不是人力能<span style="color: black;">处理</span>的问题了。同谷歌<span style="color: black;">同样</span>,百度<span style="color: black;">亦</span><span style="color: black;">重点</span>是<span style="color: black;">经过</span>技术手段来对<span style="color: black;">宣传</span>进行审查和过滤。据披露,百度为此有专门的“黑科技”系统,负责审查甄别<span style="color: black;">各样</span>虚假违规推广内容。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">区别</span>的反垃圾技术,在处理原则上都是<span style="color: black;">同样</span>的,<span style="color: black;">首要</span>是<span style="color: black;">设备</span><span style="color: black;">发掘</span><span style="color: black;">反常</span>内容后提交进一步审核的预警机制、第二是<span style="color: black;">发掘</span>异常内容后的批量处理机制、第三是处理完<span style="color: black;">反常</span>内容之后防止再次<span style="color: black;">显现</span>的屏蔽机制。这几个<span style="color: black;">过程</span>说起来容易,做起来很难,尤其对百度<span style="color: black;">这般</span>流量巨大的<span style="color: black;">机构</span><span style="color: black;">来讲</span>。技术跟不上的话就只能<span style="color: black;">增多</span>人工审核力量,这会给<span style="color: black;">机构</span><span style="color: black;">导致</span>巨额成本支出,而技术跟不上又花不起钱的话,<span style="color: black;">机构</span>迟早会被垃圾信息拖死。好在,经过十几年运营经验和技术<span style="color: black;">开发</span>的<span style="color: black;">累积</span>之后,百度已<span style="color: black;">持有</span>了一套非常有效的<span style="color: black;">设备</span>审核过滤系统。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以大数据为<span style="color: black;">基本</span>的“雷达系统”,是百度在审核与过滤有害信息及<span style="color: black;">违法</span><span style="color: black;">宣传</span>的一个利器,<span style="color: black;">能够</span>实现对95%以上的信息进行自动审核。这个系统与百度搜索本身有<span style="color: black;">类似</span>之处,<span style="color: black;">经过</span>将信息的IP、ID,<span style="color: black;">源自</span>,语义内容等素材进行大数据比对,从而<span style="color: black;">发掘</span>有害信息及违法<span style="color: black;">宣传</span>。系统<span style="color: black;">持有</span>强大的数据采集能力,丰富的数据分析维度,还有快速而准确的瞬时数据处理能力,这其中的每一种技术都不是大<span style="color: black;">都数</span><span style="color: black;">机构</span>所能够<span style="color: black;">把握</span>的。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在一个<span style="color: black;">包括</span>10万字节的word文档中,个人PC基本能做到瞬间就将相同的字词找出来,可<span style="color: black;">倘若</span>需要<span style="color: black;">查找</span>的字节是10亿量级的,且来自于<span style="color: black;">研发</span>标准<span style="color: black;">区别</span>,<span style="color: black;">包括</span><span style="color: black;">各样</span>层级体系的网页,还需要将<span style="color: black;">区别</span>维度的变量集中到一个结果中,且瞬间反应,那就不是一件容易的事情了。这<span style="color: black;">首要</span>需要相当高超的数据算法,还要有周密严谨的多个数据模型,更需要有搭建大规模计算机运算系统的能力。在互联网行业中,这些技术的总和相当于大当量“核武器”。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当然,在<span style="color: black;">日前</span>的技术<span style="color: black;">要求</span>下,<span style="color: black;">设备</span>系统再先进<span style="color: black;">亦</span><span style="color: black;">不可</span><span style="color: black;">处理</span>所有问题。以百度的审核与过滤系统来说,系统最多能让审核与过滤过程更有效率,成本更低,但还是有<span style="color: black;">有些</span><span style="color: black;">尤其</span>有技术含量的有害信息及<span style="color: black;">违法</span><span style="color: black;">宣传</span>,还是需要依赖人工的。例如<span style="color: black;">有些</span><span style="color: black;">运用</span>flash技术的动态<span style="color: black;">宣传</span>,提交时是正常的,几个小时后<span style="color: black;">亦</span>许就变成别的了。对这类<span style="color: black;">宣传</span>,虽然用系统能过滤掉大部分,但还是会有一部分需要进行人工审核。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">技术系统同人<span style="color: black;">同样</span>,<span style="color: black;">没法</span>做到见微知著,对任何细微的个性化特征都做到正确反应。在百度雷达系统里跑过一遍的信息,<span style="color: black;">必定</span>有漏网的,<span style="color: black;">亦</span><span style="color: black;">必定</span>有被冤杀的,<span style="color: black;">通常</span><span style="color: black;">状况</span>下<span style="color: black;">设备</span>系统<span style="color: black;">发掘</span>有问题但又难以下结论的信息,都会被提交到人工审核系统进行审核。<span style="color: black;">日前</span>百度的审核团队有几千人之众,这几千人负责漏杀或误杀的信息审核,三班倒24小时不间断对信息进行审核,<span style="color: black;">尽可能</span>减少问题<span style="color: black;">出现</span>。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">技术和人工<span style="color: black;">一起</span>发力抵制有害信息与<span style="color: black;">违法</span><span style="color: black;">宣传</span>,并不是完结,机制与规则方面的建设其实<span style="color: black;">亦</span>非常重要。百度有自己对商家的加V认证体系,<span style="color: black;">根据</span>信用等级将企业和商家分为V1、V2、V3三个级别,<span style="color: black;">按照</span><span style="color: black;">实质</span><span style="color: black;">状况</span>动态升级和降级,2015年四季度有27000个诚信企业升级,<span style="color: black;">同期</span><span style="color: black;">亦</span>有29700个不良商家受到了降级的<span style="color: black;">处罚</span>。信用等级的升降完全基于客观<span style="color: black;">要求</span>得出结论,找李彦宏<span style="color: black;">亦</span>是没用的。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">除了商家加V认证体系,百度口碑<span style="color: black;">亦</span>是百度推广信誉体系的一个重要<span style="color: black;">构成</span>部分。百度口碑一方面是商家<span style="color: black;">把握</span>用户口碑舆情、加强与用户互动、倾听消费者反馈的<span style="color: black;">途径</span>,另一方面<span style="color: black;">亦</span>是用户<span style="color: black;">查找</span>商家<span style="color: black;">制品</span>服务口碑、消费体验反馈、表达<span style="color: black;">评估</span>的平台。<span style="color: black;">区别</span>于其他“遍地好评”的平台,<span style="color: black;">截止</span>2016年1月,百度口碑的数据中,五星好评占79%,四星到二星的中评占15%,一星差评<span style="color: black;">亦</span>有6%。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">搜索引擎是通用的流量入口,<span style="color: black;">亦</span>是用户寻找互联网信息及服务的一道门,太多形态各异的角色想要利用这扇门达到自己的暗黑目的。<span style="color: black;">针对</span>百度<span style="color: black;">来讲</span>,虽然好客人和坏客人都能给自己带来收入,但百度还是<span style="color: black;">始终</span>在严格运用<span style="color: black;">各样</span>手段将坏客人拒之门外的,<span style="color: black;">由于</span>唯有保持一个良好的在线推广运营环境,一个始终是良币驱逐劣币的良性网络空间,百度的<span style="color: black;">长时间</span>利益<span style="color: black;">才可</span>真正得到<span style="color: black;">保证</span>。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">百度在消灭有害信息及<span style="color: black;">违法</span>推广方面的<span style="color: black;">奋斗</span>,<span style="color: black;">包含</span>技术上的和机制上的<span style="color: black;">开发</span>与建设,人力上财力上的投入与付出,都不会是一种<span style="color: black;">没法</span>收回的成本,而恰恰是一种相当重要的投资。百度把守着互联网的<span style="color: black;">前门</span>,亿万用户从百度经过,始终为用户营造良好的网络环境,百度义不容辞,其<span style="color: black;">始终</span>对违规虚假推广的严厉打击,<span style="color: black;">亦</span>值得赞许。</p>
    </div>




页: [1]
查看完整版本: 百度推广信息审核三重门:在“降妖除怪”方面的一路升级