标签归档:采集

火车头采集发布PW出错 非法请求,请返回重试 的解决

NND,今天搞了好句发布PW7.3.2的,就是不行提示是 非法请求,请返回重试,去HTML上看,发现提示的是没有登录,想着是应该COOKIE问题,或者是权限问题,后台也试了改了用户名权限等等,还是不行。后来发现那模拟蜘蛛那的问题,应该说是浏览器的问题,这个该了就好了,真郁闷,浪费了好多时间。具体解决方法。

1.在火车头采集器主窗口-选择【选项设置】-【采集发布设置】
2.在【模拟客户浏览/搜索引擎蜘蛛爬行】-选择【用户本地浏览器】
3.【本地浏览器User-Agent】点击【获取】

 

关于怎么有效防止采集

      现在虽然来说采集站越来越难做了,但是还是有很多人在采集,毕竟不需要很多精力就可以做一个内容丰富的站出来了。防采集现在虽然有很多方法,但是也没有有效方法,虽然有的能防止采集但是弊端也有很多,下面对几个放采集的方法做个总结,可能不是很全、

1。防采集就是用JS调用,列表用JS调用,或者文章的开头或者结尾替换成JS文件。但是这样对于有些禁用JS的浏览器访问,更不根本访问不到内容,或者访问内容不全。

2. 采用限制刷新次数,就是同一个IP在规定时间内刷新几次,有服务器上限制的,也有程序限制的,但是对于搜索的蜘蛛有很大影响。

3. 还有就是采用多套模板,像我采集的时候碰到多套模板就是先一个规则采集好,再找到另外一个模板的规则,再采一篇。。。。。

4、还有就是内容中增加随机字符,但是这个效果不是很大,可以过滤,除非要N多的信息,但是可以直接过滤掉网站名称相关的词,也网站地址相关的,同样可以处理。

5. 其实现在觉得一个最好的方法就是内容的部分文字生成图片,再打上图片。碰到这种基本人家看不上了、。、、