而在這個過程中,總的來說需要?三個步驟:
1、發現異常流量特征
2、將異常流量“提純”
3、分析異常流量的成因
第一步我們要找到異常流量,為了提升這個工作的效率,我總結了一套清單,希望能作為大家的工作手冊使用。我先列出清單中的項目,后文再詳細解釋:
1、分小時對比異常和正常的兩天,分別對比UV/會話/PV等指標
2、如果有其他流量統計系統,互相驗證數據準確性
如果個別小時流量變動明顯:
3、確定異常時間段,去找技術部同事排查問題(如果可能,先在域名報告、所有頁面、內容分組報告里聚焦到出問題的某部分頁面,方法見后)
4、去找運維部同事查詢,異常時段內的http請求數是否也異常(如果是,說明流量實際上確實變了;如果否,可能是統計代碼本身出問題,實際流量并沒變化)
5、去找產品/運營的同事詢問是否有產品改版,或是組織了什么在線活動
6、如果異常是均勻分布在各小時中,就要去查各個維度上,是否存在異常突出的項目,那可能就是出問題的點:
- 流量來源
- 新/老用戶
- 著陸頁
- 所有頁面(組)
- 事件
- 省份/城市
- 瀏覽器/操作系統
- 手機品牌/型號(移動端訪客)
- 上網運營商


1、斷崖式:下跌時段如此明顯,接下來我們可以直接到域名或所有頁面報告中,很容易的定位到下跌的頁面,然后去找技術和運維的同事排查問題即可。
2、個別小時小幅度異常
與明顯的斷崖式下跌相比,如果只是個別小時疑似下跌,是不太容易定位到下跌的域名/頁面的,因為缺失的流量被全天的數據“稀釋”了。但是還好,GA有強大的高級細分功能,我們可以單獨看下跌的那個小時的數據。這個過程就是本文開頭提到的“將異常流量提純”:
經過高級細分之后再去看域名報告,我們就能很明顯的定位下跌的部分了:
發現異常域名后進一步,在次級維度中調出著陸頁,就能更精準的找到出問題的頁面:
在其他流量統計系統中可能也會有類似的細分功能,總之思路是相通的,就是找到有異常的維度,然后用它做細分條件,提取出問題最集中的那部分流量。
3、全天候均勻下跌
有時候出問題的維度不是小時,例如下面這個例子:
我們發現so.com來源的流量明顯下降了,但是在小時維度數據上是比較均勻分布的:
于是這次我們不在小時上做細分,而是建立一個“so.com來源”的細分,完成異常流量的“提純”工作,接下來就要分析異常的成因了。這個過程其實也簡單,只要帶著“提純”用的高級細分,到各個報告中去尋找其他維度的異常即可。
結果是,我們在“瀏覽器”報告中發現只有Vivo系統瀏覽器數據變動很大,然后我們繼續用次級維度細分該瀏覽器帶來的流量來源,結果發現隨著so.com來源的降低,百度的流量基本在同等增加,那么原因就比較明顯了,非常可能是這個瀏覽器將搜索框里原本導給so.com的那些流量切到了百度。
三、分析系統之外還有什么工作
前文中的方法能夠應對大部分流量異常的情況了,但如果異常數據在任何維度都是平均分布的,找不到異常點怎么辦?這時候可以先打開網站/App看一下,有時候問題就擺在那里很容易發現。
另外還可以考慮一下外部因素,例如學生開學可能導致游戲相關流量下降,周末如果趕上大范圍的重霧霾天氣可能導致娛樂類流量上升(用戶們都宅在家了),我們甚至還遇到過《焦點訪談》的一個鏡頭中出現了我們的品牌,導致來訪流量大漲。尋找這些外部因素沒有一定之規,能否找到也要看一點運氣了。
本文為@運營喵原創,運營喵專欄作者。