百度信誉依托大数据与人工监测保障消费者权益.docVIP

百度信誉依托大数据与人工监测保障消费者权益.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
百度信誉依托大数据与人工监测保障消费者权益

百度信誉依托大数据与人工监测保障消费者权益 在过去的很长一段时间,虚假宣传,夸大效果,等一系列负面新闻困扰着百度,痛定思痛,百度作为最大的中文搜索引擎,在意识到这一问题之后,积极的做出反应,百度信誉体系从出台到不断的完善,在这个大数据时代,百度信誉V体系依托人工和大数据混合监控,以期让消费者更加的信赖搜索引擎。 简单的说百度信誉V体系就是对企业信誉的评级,百度首先通过这套评级机制来决定企业是否有资格在百度进行推广,并且即使已经入住的企业,“百度信誉V体系”依然会对其进行持续性的监督,中途一旦发现违规就根据具体情况进行暂停推广、警告、永久封号、上报公安等等具体措施。信誉V体系主要依托人工与大数据的混合监控,在数据审查主要分为三层递进方式,可以看成是三道防火墙。 第一道防火墙,百度没有该企业数据,要求资质信息 没有任何一家企业可以随意在百度投放推广信息,根据每个行业的审核机制不同,百度会要求提供每个行业的企业背景资料和相关证件,包括公司营业执照原件及营业执照上登记的法定代表人的身份证原件的影印件,以及法定代表人手持自己身份证的肖像照片等等。 百度通过“实名认证、资信认证、商标认证、授权认证、官网认证、诚企专区”等六大产品彻底核实企业身份信息的真实性。基本的企业信息审核,这是第一道防火墙。 第二道,百度拥有部分该企业数据,全网信用建模 只是获得企业的给到的信息是远远不够的,这等于博弈的筹码完全在对方手里,而百度方面也需要自己的筹码,也就是对方的数据信息。百度主要采取了以下数据收集的方式对该企业进行全网的信用建模。 接入政府方面的第三方数据,通过接入工商信息数据、全国个人身份信息数据等等相关部门数据,通过人工审查,实现100%的信息准确性核实,进而规避部分地区工商网站建设落后导致的人工审核受限、无企业信息可查的问题。其次是通过政府方面的监管记录可以对企业进行更严密的监控。以“苏宁”为例。 其次通过全网数据对其进行建模,百度有着可以对“事件”建模的技术,例如我们搜索“张飞”时百度可以根据全网的数据,找出一切与张飞的关联人物,诸如赵云、刘备等等,。 因此我们继续以“苏宁”举列,百度会根据“苏宁”这个关键词索引一切关联的大数据、诸如“天猫”、“京东”、“家电”、“家电”等等关键词,进行一个大的品牌建模。其中百度会抽取大数据中的诸如“苏宁电器质量怎么样?”、“苏宁发货速度好快”等等全网的相关键词搜索信息、媒体网站舆论信息、问答网站信息、百度口碑信息等等多方信息,对其进行一个信誉体系的建模,反向得出其信誉指数。 也就是说,想要在百度进行推广的企业,在其入驻百度之前,百度就已经有了其相关的大量数据信息,从政府方面提供的信息再到全网的信誉初级指数,凡是能够有该企业数据的地方百度都会不遗余力的去收集。 因此,即使一个网站给了百度初级的资质信息,但只要无法与百度取的的政府信息匹配,以及有着不良的全网信息记录评级,就不可能被允许投放推广信息。在这套系统制约下,百度信誉认证体系已封禁企业达20546家,共封禁194392个推广账户。 第三道防火墙,持续监督该企业数据,全网追踪跟进+百度口碑 推广信息动态监控,上面两道防火墙都是建立在投放推广信息之前,而让百度最为头疼的则是在投放推广信息之后,大部分作恶的企业都是在百度审核之时交给了百度一个正常的网页,而在百度通过审核之后便通过代码技术,偷偷换上自己的非法内容,瞒天过海,在百度那里原来看到的“正常内容”,到了用户那里就变成了“作恶内容”。 举个例子,一些不法推广公司会在Flash推广信息中嵌入第三方外链或php脚本内容,会根据IP、时段、设备的不同进行不同的跳转,并且还会监视百度蜘蛛的抓取技术躲避百度监控,早上同一个链接点开可能是正常的钢材推广信息,但是到了晚上就变成了色情内容,而百度面通过建立程序员组建立Flash信息的代码解析模块,24小时监控,主动发现其中“不应出现”的外链或php脚本内容。 经过这么多年的“交手”,百度目前基本已经杜绝推广信息作弊。去年百度共封禁Flash账户超1.5万个,涉及Flash信息数超570万条,其中机器拒绝违规Flash信息通过共近60万条。 全网数据动态监控,“百度信誉V”体系并非永久不变,对于百度来说除了在企业主推广之前对其进行全网建模以外,还会持续跟进对其信誉的评级,一旦在权威媒体网站或者在关键词搜索中检索到其负面内容,或者检测到政府方面对该企业给予了处罚内容,那么企业信誉则会发生相应波动,而当波动幅度过大时,百度方面会立即进行人工检查,并可能立即停止其推广行为。 百度口碑,该项目是百度内部自建项目,通过利用百度用户的UGC内容对各大网站内容进行用户评级,这也是“百度信誉V”体系中的一环。目前百度口碑中集成了评论、实名曝光、舆情观察等内容。用户的海量曝光投诉,对“百

文档评论(0)

kaiss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档