『QQ:1353814576』

百度统计里面发现被刷了好多乱七八糟的SEO垃圾搜索词广告怎么办?


百度统计里面发现被刷了好多乱七八糟的SEO垃圾搜索词广告怎么办

百度统计搜索词好多乱七八糟,要怎么处理?

网站被刷了垃圾广告词

前些日子发现百度统计里面实时访客里面挺多流量来源很奇怪 都是其他的域名用问号拼接了博客域名的形式 类似于 http://********.com?http:www.yuantk.com 这种形式 而关键词基本一看就是带有seo、快排 等之类的垃圾广告词 超级碍眼有木有

比较奇怪的是服务器本地的ip日志访问记录统计根本找不到这些ip的访问记录信息 也就是压根没有访问过网站 ,一度以为是百度统计出问题没统计到,实际当然并不是百度统计出的问题,但也算是一个漏洞吧,百度了一下大概原因是这样的

刷广告的大概原理分析

操作的人通过“某流量神器”指定搜索词来源的方式打广告,批量模拟请求数据会被百度统计到,实际情况应该是你的百度统计js里面的标识码泄露了。操作者使用工具进行了伪装的百度搜索结果跳转跳给你,百度记录了这些跳转的参数,打广告的一种途径,实际根本没有给目标站带来任何流量,甚至有可能附带的网址很可能就是些骗子网站(建议站长们最好不要太好奇)

后面的这一串****字符就是标识码
https://hm.baidu.com/hm.js?*************************

两种解决办法

这类泄露一般是网站在网络留下了痕迹, 被此类爬虫寻迹抓取到了百度统计代码里的标识码。所以我们需要在百度统计后台删掉的原来的统计js代码(因为之前已经泄露了 再处理也就没有意义了),再重新创建一个新的网站统计,然后使用前对这段代码进行防泄露处理,以下提供有两种方案

一、给统计代码整体加密处理

在网上找个js在线加密工具 然后把加密后的代码放进网页里,然后只要确认可以正常统计就可以了,这个相对比方法二理论上更可靠一些(只是觉得加密后的是否能正常工作存在不确定性),因为没做过测试这里不过多做评论。

二、打乱统计链接的统计字符 通过js动态还原地址

原理就是假定此类蜘蛛检索一般是去以hm.baidu.com/hm.js 为关键词去检索网站的百度统计代码的,如果链接地址被打乱掉了,理论上程序也就无法找到了(毕竟只是个程序,没那么智能),当然如果人家真的人工来翻(当然因为这类工作量太大纯人工搜集的可能性不大) 还是有可能被找到的,包括方法一的js脚本加密方案

举个例子代码如下:

var adsrc = ['h', 't', 't', 'ps', ':', '/', '/', 'h', 'm', '.', 'b', 'a', 'i', 'd', 'u', '.c', 'o', 'm/', 'h', 'm', '.j', 's', '?', '????', '????', '????', '????', '????', '????', '????',????'].join('');
	//百度统计
	var _hmt = _hmt || [];
	var domain = window.location.host;
	//判断运行环境
	if (domain.toLowerCase().indexOf("yuantk") > -1) {
		var ad = document.createElement("script");
		ad.src = adsrc;
		var s = document.getElementsByTagName("script")[0];
		s.parentNode.insertBefore(ad, s);
	}

考虑到二者都只能应对机器爬虫外以及方案一存在不确定性再加我比较偷懒 就选择了第二种 目前用了几天,目前统计后台一片清爽

网站百度统计里面发现被刷了很多SEO垃圾广告怎么办?