在线统计 vs 日志分析 ( Page Tagging vs Log Analysis )

网站流量分析(Web Analytics)的工具分为两大类, 一类是以Google Analytics为代表的在线统计系统, 英文称Page tagging。国内的武林榜,51yes,国外的Hitbox, Nielsen NetRatings, OneStat 都属于此类。这一类的重要特点是,分析时需要在里页面嵌入代码,这也是Page Tagging这个词的由来。 另一类就是日志分析,英文称Log Analysis, 特指web服务器的日志分析就是Web Log AnalysisNihuo Web Log Analyzer, awstats, analog 都属此类,这一类的特点是不用在页面嵌入代码,而是靠分析web 服务器产生的日志来生成统计报表。

经常有人问起这两种方法哪个更好,解释次数多了,自己都烦了,现在在这里统一回答一下。涉及到两类产品的比较时,就分别以Google Analytics( http://www.google.com/analytics/ )和Nihuo Web Log Analyzer( http://www.loganalyzer.net/ )为例了。

网站流量分析机制的差异

在线网站流量统计(Page tagging)的实现机制

Google Analytics需要在所有需要统计的页面中插入如下的Java Script统计代码,只有插入了代码的页面才能被统计,

  1. <script xsrc="http://www.google-analytics.com/urchin.js" type="text/javascript">
  2. </script>
  3. <script type="text/javascript">
  4. _uacct = "UA-xxxxxx-x"; //统计帐号
  5. urchinTracker();
  6. </script>

这段Java script做的工作如下:

其他的在线统计系统与Google Analytic有些细微的差别, 比如Nielsen NetRatings要求嵌入的javascript代码中还包含有如下代码:

  1. <noscript>
  2. <img  xsrc="//secure-cn.imrworldwide.com/cgi-bin/m?ci=cn-sina2006&amp;cg=0"  alt=""/>
  3. </noscript>

这确保了在javascript被禁止的客户端,用户的访问也能被统计。当然,这种情况下能统计的信息很有限了。关于这些在线系统实现方法上的一些细微差别做过专门研究,说起来就很长了,哪天有时间会单独写个文章讲这个话题。

日志分析(Web Log Analysis)的实现机制

Web服务器在工作时会把所有用户发过来的请求和相应情况记录在文件里,这个文件就是日志文件。下面就是从http://www.loganalyzer.net/log-analysis-tutorial/log-file-sample-explain.html 找到的一行日志:

111.111.111.111 - - [08/Oct/2007:11:17:55 -0400] “GET /support.html HTTP/1.1″ 200 10801 “http://www.google.com/search?q=log+analyzer&ie=utf-8&oe=utf-8 &aq=t&rls=org.mozilla:en-US:official&client=firefox-a” “Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.8.1.7) Gecko/20070914 Firefox/2.0.0.7″

在这一行里包含了客户端IP(111.111.111.111),时间([08/Oct/2007:11:17:55 -0400] ),请求方法(Get),请求文件(/support.html ),HTTP协议版本(HTTP/1.1),返回状态码(200,表示成功),文件大小(10801 ),Referrer信息(”http://www.google.com/search?q=log+analyzer&ie=utf-8&oe=utf-8 &aq=t&rls=org.mozilla:en-US:official&client=firefox-a”),Agent信息”Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.8.1.7) Gecko/20070914 Firefox/2.0.0.7″)。具体如何详细解读日志会另文阐述,在这里只是展示一下日志中都包含什么信息。

Nihuo Web Log Analyzer就是靠读入日志文件在本地进行统计计算而得出最终报表的。在大部分Web日志文件中,都是靠IP来判断访问者。Nihuo Web Log Analyzer也可以通过Cookie识别用户,但需要在日志中首先输出Cookie信息。

在线统计日志分析的优缺点比较

上面费比较多的笔墨说两者的实现机制,就是为了大家能更好理解这一段,因为两种方法的优缺点都是由他们的实现机制决定的。

在线网站流量统计(Page tagging)的优点

在线网站流量统计(Page tagging)的缺点

日志分析(Web Log Analysis)的优点

日志分析(Web Log Analysis)的缺点

经常有人问这两种方式哪个更好,应该选择哪种,这让我很难回答。 因为这两种方式都各有所长各有所短,只用一种方法很难准确完整的了解网站流量的的全貌,我自己做分析时两种工具都使用的,两个报告互相参考着看,也推荐大家采用这个方式。

注:这篇文章借鉴了一些 http://www.kichus.in/2006/09/23/log-file-analysis-page-tagging/ 的内容

Written by oldmonk on 十一月 12th, 2007 with 1 comment.
Read more articles on IT.

Tags: , , , , , ,

Related articles

1 comment

Read the comments left by other users below, or:

引用

Get your own gravatar by visiting gravatar.com newstart
#1. 十一月 15th, 2007, at 11:46 AM.

受教了,学到不少东西哈

[回复此评论]

Leave your comment...

If you want to leave your comment on this article, simply fill out the next form:




  • :em10:
  • :em01:
  • :em13:
  • :em04:
  • :em05:
  • :em06:
  • :em12:
  • :em09:
  • :em07:
  • :em08:
  • :em21:
  • :em17:
  • :em33:
  • :em03:
  • :em02:
  • :em31:
  • :em34:
  • :em28:
  • :em14:
  • :em32:
  • :em36:
  • :em38:
  • :em16:
  • :em11:
  • :em18:
  • :em20:
  • :em22:
  • :em15:
  • :em19:
  • :em23:
  • :em25:
  • :em24:
  • :em29:
  • :em30:
  • :em27:
  • :em35:
  • :em26:
  • :em56:
  • :em57:
  • :em54:
  • :em37:
  • :em45:
  • :em46:
  • :em42:
  • :em39:
  • :em44:
  • :em51:
  • :em60:
  • :em43:
  • :em40:
  • :em49:
  • :em41:
  • :em47:
  • :em48:
  • :em50:
  • :em55:
  • :em58:
  • :em53:
  • :em52:
  • :em66:
  • :em64:
  • :em68:
  • :em65:
  • :em61:
  • :em59:
  • :em67:
  • :em70:
  • :em71:
  • :em62:
  • :em63:
  • :em69:
  • :em72:

You can use these XHTML tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> .

 
Web www.doyj.com