server side, client side網頁分析

在線上服務的網站,怎麼知道它的狀況如何?是否需要增加機器?或者所辦的活動,吸引多少虛擬的人潮?創造了多少效益?如果以後面的需求來看,就需要去蒐集、分析網站的資料了…

以前,為了作這些分析,看了幾套免費的log分析軟體,最後選用 AWStats這套。除了覺得他所提供的資訊簡單好用外(有時候,這點很重要),還看中他有提供 Worms attacks 的列表,想利用他知道每天是不是都有不速之客?(雖然,最後感覺不出其實用性)。之後,也開始使用Google Analytics來作分析。使用一段時間之後,總是感覺兩邊所統計出來的資訊有差異。

思考了一下原因…主要如下吧~
  • AWStats作分析時,有刻意將來自於公司內部的流量不作計算,避免『虛胖』的流量。但是在Google Analytics中並無這樣的設定。
  • Google Analytics必須要在網頁中埋入他們的javascript,方可達到紀錄、分析。然而,網頁都會埋入,例如…漏埋javascript的網頁、或非網頁模式(如web service)等...
  • AWStats是直接將web server所產生log作分析,這些log所記錄到的資訊,很多是Google Analytics所無法取得的。(如被hacker攻擊時)
因此,我總認為直接分析web server log的 AWStats,所產生的分析結果應該比較準確。畢竟…凡走過必留下足跡!(比如說,hacker用工具再打網站時,就會產生『較多』的log,分析項目中的http 404數量就會增加)。直到前陣子看到兩篇文章…才覺得我的想法不完全正確
很巧的,兩篇文章中所提及的log分析工具和我所用的相同。其實,文中是將這兩套視為Server-Side Data Collection and Analysis( AWStats)和Client-side Data Collection and Analysis( Google Analytics),並說明這兩種log分析的的優點和缺點。

看完第一篇,才點醒我原本的想法不完全正確。如文中所述,現在的網路環境-如proxy等,反而會讓request不會到web server,當然也就不會產生任何記錄。但,Client-side Data Collection and Analysis( Google Analytics)卻可以記錄到。


附註:
其實還是有些免費(或者有條件下免費)的軟體很好用…

留言