一、Javascript代码的操作
- Javascript数量影响蜘蛛的抓取。如统计工具过多、仿站等。
- Javascript冗余代码过多,影响网站加载速度。Javascript冗余代码过大会影响蜘蛛的爬取速度。page speed
- 最好把你的JS文件进行合并。能放到一个js代码文件中尽量不要分开。
二、缓存的设置(Cookie)
浏览器缓存:动态网站才有缓存设置,静态没有缓存设置。应该设置一周时间为最佳!
三、框架代码
框架代码:不利于蜘蛛的抓取,可以用纯文字网页浏览器模拟蜘蛛抓取效果。对比原网页跟纯文本浏览器显示的效果有那些。从而对网站的代码进行优化。搜索引擎的爬取程序看到我们的网页的样子就是纯文本浏览器显示的形式。http://www.delorie.com/web/lynxview.html
四、Flash或页面的错位
- Flash蜘蛛抓取不到内容。打开速度慢。
- 如果说你的网页在几个主要流量不兼容,那么你的网页质量是要被扣分的。
- 页面的兼容出现问题本身就会增加的跳出率。
五、网站安全
检测网站的安全,网站有木马。检查方法从友情链接检查工具查看完整有无被挂黑链。网站要提前做好备份。一般不要轻易的告诉自己网站相关密码或者权限。