流量分析原理 流量统计原理主要有两种:传统的基于日志文件统计和当前较为流行的基于脚本(JavaScript 等)统计。 01、基于日志文件的统计 通过分析网站后台的日志文件来统计访客的浏览和点击行为。 这种方法的优点是简单方便,无需修改网页代码,可以收集网络爬虫数据等。 缺点是网站日志包含所有日志数据,需预处理来提升数据质量;且无法统计到页面缓存导致的缓存浏览数据。 02、基于脚本的统计 此方法需要在网站的html代码中嵌入一段脚本(JavaScript等)用于统计访客的浏览等行为。 这种方法的优点,包括: 01、技术难度低,只需嵌入脚本代码,无需配置服务器; 02、能够快速获取点击、响应等数据并方便展现; 03、不需要担心缓存带来的影响,数据的准确度较高。 缺点主要是:无法统计网络爬虫的信息。 当前主流的流量分析系统绝大部分采用此种方法收集数据,包括百度统计和谷歌分析等。 以下为网站分析工具的JavaScript收集数据流程图: |