首页 > 资讯 > 评论

315重拳出击:百度AI打击变体词推广

2018/03/12 19:07      IT产业网   


  当7.7亿的中国网民迎来互联网的又一次进阶,广告营销也开始不断打破边界,多元化愈发明显。然而,仿照品牌名的变体词推广却也成为一些投机取巧者“玩花样”的手段之一,且随着互联网规模的扩大,花样也更多。为此,百度正利用人工智能技术打击五花八门的变体词,全面查处虚假违法互联网广告,维护互联网安全和网民合法权益。

  “变体词虚假广告”是投机者牟利的惯用伎俩。该手段常通过替换某个字体、改变顺序等方式迷惑网民,例如将“朌朌防盗门”混淆形近的“盼盼防盗门”,“平果维修”混淆同音的“苹果维修”,或在“App Store”设置关键词保护的情况下,绕道“app-store”试图仿冒正规平台。

图片1_meitu_1.jpg

  头痛的是,“变体词虚假广告”具有很强的迷惑性,投机者们“钻汉语空子”的能力惊人。百度提供的资料显示,基于现有系统品牌及变体规则的词库达到几十万,还包括更大数量的关键词变体词、谐音词、关联词。通过百度的这份内容丰富的变体词限制关键词词库,我们可以看到百度技术系统与巧妙利用丰富汉语词汇的投机者间存在着复杂的博弈关系。在这场猫鼠游戏中,AI技术的作用更为显现,天平已经开始出现不可逆转的倾斜。

  据悉,百度针对变体词有专门的技术专利。其中“一种授权信息的识别方法及装置”技术专利在2016年就得到了国家的权威认证。该技术通过解析获取预定网站的内容,能够识别所述预定网站的内容中的徽标信息,并根据预定授权信息和所述徽标信息确定所述预定网站的合法性。

  “盼盼”防盗门的品牌保护就是一个典型的例子。此前,有推广客户以“朌朌”进行推广,试图以假乱真“盼盼”防盗门。百度技术系统监测到此情况后,自动升级添加“朌朌”的变体词。据百度技术人员介绍,“盼盼”的品牌变体词十分常见,但“盼盼”因有很多重合度,如熊猫盼盼、盼盼食品,还有盼盼防盗门等,所以技术会根据相关内容进行识别,最后展示相应的搜索结果。目前,“盼盼”防盗门全名是“亚萨合莱盼盼门业”,因此在展示结果上会排在后面。百度技术人员称,“品牌名称越短,对技术的挑战越大。”随着机器学习能力快速提升,百度的变体词限制量也以指数级扩展。

图片2_meitu_2.jpg

  数据显示,2018年以来百度变体词虚假广告总数超过7亿,其中品牌变体词占到近30%。庞大的变体词库量背后是打击压力的增大,同时也显现出百度AI赋能后的效果显著。通过机器系统对发布者进行资格审查和内容审查是第一道防线,真正的难点在于在广告上线后的动态审查。百度利用机器系统实现对95%以上的信息进行扫描过滤,每天过滤超过4.7亿条,剩下的5%的内容审查,百度还雇了上千人的队伍进行人工核查。

  “百度对虚假广告是零容忍。”百度内容安全中心的负责人强调,“但人工筛选远远不够,百度AI技术的发展给我们提供了武器,就像突然拥有了几亿双眼睛帮你看互联网上的信息,骗子的小聪明根本逃不过去。在技术的支持之下,我们全面扩大变体词的策略,从而有效保护品牌,使网络平台更加风清气正。”

  值得注意的是,百度变体词监管的策略也在不断优化。2018年以来百度依靠新体系下线了近2亿变体词物料。同时,百度加大对变体词的打击力度。2018年2月,北京假冒“苹果”维修第一案开出27万余元的罚单,百度进一步强化对“苹果维修”的品牌保护,加强变体词限制力度,还增加了“部分搜索结果并非苹果官方维修店,建议到苹果官网查询”的提示语。

  业内人士表示,此前全网品牌变体词占比巨大,对网民与品牌权益均造成了巨大的损害。如今,百度通过AI技术专利的加持,对品牌实现了有力保护,和既保障了品牌,也保障了消费者的合法权益。

  榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。

相关阅读