在之前的介绍中,我们已经拿到了服务器的访问日志,在接下来我们要对日志做分析和处理,然后根据日志的详细信息,对网站内容做进一步的优化和调整,这同样是我们在网站制作过程中的一个重要环节,下面介绍一下日志统计功能的开发:
1、服务器访问日志文件
a) 在之前的介绍中,我们已经在服务器保存访问日志,然后我们可以通过多种方法,把日志下载到本地,或者直接保存到网站的日志目录,保证我们的程序可以访问到网站的日志即可。
b) 日志文件一般为文本文件,同样具体看服务器保留格式。
2、网站日志分析内容介绍
a) 网站日志可以进行多少方法和角度的分析统计,我们这里只做简单的介绍,具体的需要根据公司网站的需要,做具体分析。
b) 蜘蛛统计是根据访问信息,统计网站蜘蛛来源,以及时间,本文是统计蜘蛛为介绍。
c) ip统计是根据ip地址,详细统计ip来源,以及时间,在之后的文章中,我们会进行ip信息的统计和分析。
d) 浏览器统计是根据浏览器类型进行统计,些功能暂时不开发,需要的可以参考其它案例格式进行开发统计。
e) 电脑手机统计是根据浏览器的类型,进一步的统计是pc浏览器,还是手机浏览器访问,此功能同样暂时不开发。
3、网站蜘蛛类型介绍
a) 百度蜘蛛_2.0(baiduspider/2.0;),括号内全部内容为百度蜘蛛标识,也可以需要和严谨做适当调整。
b) 百度云观测蜘蛛(baidu-yunguance-slabot(ce.baidu.com)),括号内全部内容为百度云观测蜘蛛标识,也可以需要和严谨做适当调整。
c) 百度渲染蜘蛛_2.0(baiduspider-render/2.0;),括号内全部内容为百度渲染蜘蛛标识,也可以需要和严谨做适当调整。
d) 谷歌搜索蜘蛛_2.1(googlebot/2.1;),括号内全部内容为谷歌蜘蛛标识,也可以需要和严谨做适当调整。
e) 搜狗搜索蜘蛛_4.0(sogou web spider/4.0),括号内全部内容为搜狗蜘蛛标识,更多搜狗蜘蛛信息,可供参考(+http://www.sogou.com/docs/help/webmasters.htm#07)。
f) 神马搜索蜘蛛_5.0(yisouspider/5.0),括号内全部内容为神马蜘蛛标识,也可以需要和严谨做适当调整。
g) 必应搜索蜘蛛_2.0(bingbot/2.0;),括号内全部内容为必应蜘蛛标识,微软必应(英文名:bing)是微软公司于2009年5月28日推出,用以取代live search的全新搜索引擎服务。
h) sem蜘蛛分析_3(semrushbot/3~bl;),括号内全部内容为sem蜘蛛标识,semrushbot分析你站点,收集你站点信息的,可用于竞争对手分析数据。
4、网站其它日志信息
a) 通过上面的网站蜘蛛访问信息,我们可以把日志分割为两块,一部分是蜘蛛的访问日志,另外一部分就是其它的访问日志,我们还需要对其它的访问日志做进一步的分析。
b) 其它日志是网站访问日志中比较重要的部分,通过蜘蛛日志,我们可以判断出各大搜索引擎对网站的一些信息,那么通过其它日志,我们可能分析出,一些恶意访问或者攻击信息,以及用户的访问喜好信息(一般通过统计代码分析,而不是访问日志)。
5、网站日志统计分析的开发和实现
a) 我们以php语言开发为例,首先读取文本文件,并保存为数组。
b) 我们把需要分析的内容,保存为另外一个数组。
c) 最后通过两个数组的多次循环,得到我们想要的数据。
d) 以下是我们一个网站半天的访问数据信息
e)
一个网站设计的好坏,并不只是靠眼睛去看IDC、CDN、云服务商如何进行IPv6改造升级?百度关键词数据库的更新对SEO有什么影响HTML5如何实现网页播放器当前几种网络推广模式哪种比较好?有什么优点跟缺点?为什么越来越多的商家选择小程序?重庆seo排名网站运营如何做出效果web网页设计的重要注意事项