Home » Phân Tích » Google Analytics Và Tại Sao Nó Không Chính Xác

Google Analytics không cần phải bàn cãi gì nữa chính là công cụ đo lường phổ biến nhất hiện nay với khả năng thu lại được toàn bộ các hoạt động của người dùng trên website và cung cấp cho bạn những báo cáo khá chi tiết. Cũng như mọi loại công cụ tracking khác, Google Analytics chỉ có thể cung cấp cho bạn các con số, các dữ liệu và việc bạn rút ra những nhận định gì từ các thông tin này là việc của bạn. Tuy nhiên, vấn đề ở đây là có rất nhiều người hiện đang hiểu một cách không đầy đủ về ý nghĩa của các dữ liệu được cung cấp đó và việc này có thể dẫn đến việc đưa ra các quyết định sai lầm khi đánh giá. Bài viết này nêu ra tất cả những lý do tại sao các số liệu của công cụ đo lường Google Analytics không chính xác hoặc bị hiểu sai và cách để xử lý, hạn chế những vấn đề này.

Google Analytics hoạt động như thế nào?

Tuy nhiên đầu tiên chúng ta nên hiểu sơ lược qua cách thức hoạt động và thu thập dữ liệu của Google Analytics. Điều này cần thiết để chúng ta có thể hiểu việc tại sao một số dữ liệu, thông số lại phát sinh sự sai lệch như vậy. Dưới đây là sơ đồ về cách thức hoạt động của Google Analytics:

cach-hoat-dong-google-analytics.png

Quy trình hoạt động của Google Analytics – by Conversion.vn

(1) Khi set up Google Analytics bạn sẽ cần cài đặt 1 đoạn code Javascript vào website của bạn. Đoạn code này hiện diện ở trang web nào của website bạn thì nó có thể thu thập các data ở trên trang đó.
(2) Khi người dùng truy cập vào website thông qua các thiết bị như máy tính, điện thoại bằng các trình duyệt thì lúc này một số thông tin như việc người dùng đến từ đâu, sử dụng trình duyệt gì, thiết bị gì để truy cập, v.v… sẽ được thu thập. Một số website cũng sẽ để lại cookies (nôm na là một file lưu trữ các hoạt động, hành vi của người dùng trên website đó) trên thiết bị của người dùng.
(3) Các thông tin thu thập được từ người dùng khi truy cập vào website, khi này là các dữ liệu thô (raw data), sẽ được đóng gói và gửi về server của Google Analytics.
(4) Khi các thông tin đã được nhận tại server thì tiếp theo các chúng sẽ được xử lý, phân tích. Đây là bước mà sẽ biến những dữ liệu thô thành thông tin mà có thể có ích cho người dùng.
(5) Sau khi các thông tin đã được phân tích, chúng sẽ được đưa vào cơ sở dữ liệu và được áp lên những filters, những settings do người dùng thiết lập. Một khi data đã được đưa vào database thì không thể nào thay đổi được nữa. Đó là lý do vì sao mỗi khi bạn có những thay đổi gì đó về filters, settings trên Google Analytics thì những dữ liệu cũ sẽ không thay đổi mà chỉ có dữ liệu mới nhận vào mới vậy.
(6) Lúc này các dữ liệu đã được xử lý sẽ được gửi tới phần report của Google Analytics, chính là những gì bạn sẽ thấy trên google.com/analytics.

Cũng không quá khó hiểu phải không?

Vậy lúc này điều gì có thể khiến các dữ liệu mà bạn thấy trên Google Analytics không chính xác? Có rất nhiều nguyên nhân, chủ quan lẫn khách quan sẽ được nêu ra dưới đây:

Hiểu không đầy đủ ý nghĩa của các nguồn traffic trong báo cáo

Đây là vấn đề thường thấy nhất mà đa phần mọi người đều mắc phải. Các báo cáo về nguồn traffic mặc định được thiết lập để giúp người quản trị web biết được người dùng đến website của bạn bằng cách nào và từ đâu. Có các mảng traffic chính trong report của Google Analytics bao gồm:

kenh-traffic-google-analytics.png

Các kênh traffic chính được phân chia trong phần Acquisition của Google Analytics. Nguồn: conversion.vn

Các nguồn traffic này như bạn thấy có thể bao gồm: Display, Paid Search, Organic Search, Direct, Referral, Social, Email và (Other). Và dưới đây là cách mà các nguồn traffic này thường được hiểu:

Organic Search: người dùng đến website từ các bộ máy tìm kiếm (Google, Yahoo, Bing, v.v…) thông qua kết quả tìm kiếm tự nhiên (organic).
Paid Search: người dùng đến website từ các quảng cáo trên kết quả tìm kiếm.
Display: người dùng đến website từ các quảng cáo banner trên các website thuộc display ad network.
Referral: người dùng đến website bằng cách bấm vào các đường link từ các trang web khác.
Social: người dùng đến website thông qua các kênh mạng xã hội như Facebook, Google+, LinkedIn, v.v…
Email: người dùng đến website bằng cách bấm các đường link trong email.
Direct: người dùng đến website bằng cách gõ địa chỉ web vào trình duyệt hoặc mở bookmark.
(Other): người dùng đến website bằng các nguồn traffic khác không nằm trong các kênh phía trên.

Nhưng có lẽ bạn sẽ ngạc nhiên nếu biết rằng nếu chỉ hiểu theo ý nghĩa bên trên thì bạn sẽ đa phần là hiểu không đầy đủ những gì các dữ liệu này đang đưa ra và đôi khi một nửa sự thật thì không còn là sự thật nữa. Trên thực tế có rất nhiều nguồn traffic đang bị sắp xếp sai mục, không đầy đủ và lẫn lộn trong report của Google Analytics.

san_dean_surprised.gif

Hả?

Yes, khi xem report của Google Analytics và nhìn vào các kênh traffic, thì đây là cách bạn nên hiểu:

Organic Search: người dùng đến website từ các bộ máy tìm kiếm thông qua kết quả tìm kiếm tự nhiên mà Google Analytics có thể nhận diện được và thực chất một phần organic traffic lại là direct traffic và ngược lại.
Paid Search: người dùng đến từ các quảng cáo trên kết quả tìm kiếm nếu được gắn code tracking đầy đủ, một phần traffic có thể nằm bên referral và direct traffic.
Display: người dùng đến từ các quảng cáo banner trên các website thuộc display ad network nếu được gắn code tracking đầy đủ, một phần traffic có thể nằm bên referral và direct traffic.
Referral: người dùng đến website bằng cách bấm vào các đường link từ các trang web khác đôi khi có thể bao gồm traffic từ các social networks, emailcác kênh quảng cáo (cả paid search và display).
Social: người dùng đến website thông qua các kênh mạng xã hội mà Google có thể nhận diện được.
Email: người dùng đến website bằng cách bấm các đường link trong email có gắn code tracking.
Direct: các nguồn traffic không xác định được nguồn gốc đều sẽ được đưa vào đây.
(Other): các nguồn traffic có source / medium tuy nhiên Google Analytics không biết phân chia vào đâu sẽ được đưa vào đây.

Đấy, rõ ràng các nguồn traffic về thực chất không phải như bạn thấy và không phải lúc nào cũng đúng như tên gọi của nó. Khi phân tích và đánh giá dựa trên những con số được cung cấp, chúng ta nên hiểu rõ là thực chất sẽ luôn có những “hạt sạn” trong mớ data đó. Các “hạt sạn” này to hay nhỏ thì còn tùy vào nhiều yếu tố và chúng ta hãy cùng xem qua dưới đây.

Organic Search

Organic search traffic được biểu thị trong Google Analytics là Organic Search (phần Overview) hoặc medium là organic (trong source / medium). Nguồn traffic này có một số yếu tố sau đây chi phối mà bạn cần chú ý.

1. Branded vs non-branded

Organic search traffic bao gồm cả các branded traffic, tức là các traffic mà từ khóa mà người dùng sử dụng để tìm kiếm có chứa tên thương hiệu trong đó. Ví dụ brand ở đây là Wall Street English và thay vì tìm kiếm với từ khóa chung chung là “học tiếng Anh” thì người dùng có thể tìm kiếm bằng từ khóa “học tiếng Anh Wall Street English” và bấm vào kết quả tìm kiếm tự nhiên để vào website. Lúc này về mặt kỹ thuật, các traffic này vẫn là search traffic nhưng về mặt bản chất thì người dùng đã biết đến Wall Street English từ trước và họ tìm kiếm với mục đích là để đến website của brand này chứ không phải để tìm kiếm sự lựa chọn nữa. Và branded traffic thường có xu hướng gia tăng khi nhận diện thương hiệu của brand được gia tăng (thông qua các hoạt động quảng cáo, branding, PR) chứ không liên quan nhiều đến kết quả thứ hạng các từ khóa và hoạt động SEO. Một số khách hàng và công ty mà tôi đã có dịp tư vấn qua thì organic traffic của họ tăng trưởng đều đều nhưng sau khi kiểm tra lại thì thực chất phần tăng trưởng đó là branded traffic và phần này có khi chiếm tới 80% tổng số organic traffic. Lúc này thực chất, từ khóa duy nhất mà các công ty này đang rank có lẽ chỉ là tên thương hiệu của họ.

Giải pháp

Vì các lý do nêu trên, các branded traffic nên được xem như là direct traffic thì sẽ chính xác hơn về mặt ý nghĩa để đánh giá và phân tích. Trong Google Analytics nên thiết lập một segment để đo lường branded traffic và non-branded traffic riêng biệt để có đánh giá chính xác hơn về tình hình thực sự của organic traffic mà không bị ảnh hưởng bởi người dùng tìm kiếm về thương hiệu.

Cách thiết lập segment cho Branded Traffic: vào mục Organic Search trong Channels, phía trên cái graph sẽ có dòng Add Segment, bấm vào đó. Sau đó bấm New Segment, đặt tên là Branded Organic Traffic hay đại loại, trong bảng đó bấm vào Traffic Sources, khung medium chọn contains sau đó gõ vào “organic”. Sau đó trong phần Conditions bên dưới trong khung đầu tiên chọn “Keyword”, khung thứ hai chọn “contains” sau đó phần khung còn lại điền vào brand của mình. Nếu brand có nhiều cách gọi hoặc cách gõ thì tốt nhất nên nhập hết bao gồm cả typo, ví dụ “wall street english”, “wse”, “wallstreet english”, “wsenglish”. Sau đó bấm Save là xong.

branded-organic-traffic.png

Nên thiết lập một segment để tracking traffic liên quan đến branded keywords. Nguồn: conversion.vn

2. Một phần direct traffic có thể là organic traffic

Google Analytics thường xác định visits thuộc về nguồn traffic nào dựa vào referrer, tuy nhiên vì một lý do nào đó mà referrer này lại bị mất dẫn đến việc các traffic đó sẽ bị xếp loại vào direct traffic. Vậy bao nhiêu organic traffic hiện đang bị tính vào direct traffic? Một nghiên cứu được tiến hành bởi Gene McKenna – Product Manager của Groupon đã cho thấy rằng có thể có tới 60% direct traffic của bạn hiện tại là organic. Con số đó có thể chỉ là trong trường hợp của Groupon, một trang deal / e-commerce, tùy theo tình trạng website của bạn như thế nào, số lượng organic traffic của bạn bị lẫn trong direct traffic có thể nằm trong khoản 20% – 80%.

Giải pháp

Kiểm tra trong phần direct traffic của report và chú ý tới các URLs dài, khó nhớ và khó có khả năng người dùng gõ trực tiếp vào trình duyệt hoặc bookmark, chúng nhiều khả năng không phải là direct traffic mà chính là organic traffic.

 long-tail-organic-traffic-trong-direct.png

Có thể chúng là organic traffic, chứ không phải direct traffic. Nguồn: conversion.vn

3. Không phải tất cả search engines đều bình đẳng

Google mặc định sẽ nhận diện được các organic traffic từ Google (yeah, duh) và các search engines lớn như Bing, Yahoo, Baidu, v.v… Tuy nhiên một số search engines nhỏ hơn, đặc biệt là các search engines nội địa như Coccoc.com, Wada.vn hoặc Laban.vn thì sẽ lại không nằm trong phần organic mà bị lẫn vào trong kênh referral.

organic-traffic-in-referral.png

Ngay cả traffic từ Google đôi khi vì lý do gì đó cũng bị lẫn vào mục referral. Nguồn: conversion.vn

Giải pháp

Bạn có thể set up để add các bộ máy tìm kiếm vào danh sách các nguồn organic traffic. Vào phần Admin của Google Analytics > Property > Tracking Info > Organic Search Sources và bấm Add Search Engine sau đó điền các thông số tương ứng. Ví dụ: domain name là domain của search engine và query parameter là phần trước dấu “=” trong kết quả tìm kiếm của search engine đó, trường hợp của Wada.vn là “q”.

search-engine-add.png

Thêm wada.vn vào danh sách search engine. Nguồn: conversion.vn

4. Đa phần organic keywords đã bị ẩn

Trong Google Analytics trước đây bạn từng có thể xem được những từ khóa nào người dùng đã sử dụng để đến website của bạn, tuy nhiên từ nằm 2011 Google dần dần che mất các từ khóa này với lý do là bảo mật và privacy cho người dùng. Hiện nay nếu có ai đang logged in vào tài khoản Google và search từ khóa nào đó để đến website của bạn thì từ khóa đó sẽ bị đưa vào nhóm “not provided”. Hiện nay số từ khóa nằm trong nhóm “not provided” đã lên đến hơn 90% tổng số từ khóa. Điều này chắc chắn gây khó khăn cho người dùng trong quá trình phân tích về organic traffic của website.

organic-keywords-hidden.png

Hiện nay hơn 90% organic keywords đã bị ẩn đi trong Google Analytics. Nguồn: conversion.vn

Giải pháp

Hiện nay không có cách nào để xử lý vấn đề này trừ việc bạn bỏ tiền vào quảng cáo Paid Search để có thể biết được người dùng tìm kiếm các từ khóa gì để đến website của bạn. Bạn cũng có thể connect Google Analytics với Google Search Console (trước đây là Webmaster Tool) để có một số thông tin về search queries trong phần SEO. Tuy nhiên lưu ý rằng keywords và search queries về cơ bản vẫn khác nhau và search queries là data lấy từ Search Console nên không có liên quan với các data khác trong Google Analytics.

Paid Search và Display là 2 nguồn traffic quảng cáo chính được mặc định trong Google Analytics với Paid Search là traffic đến từ các kết quả quảng cáo của các search engines như Google, Bing, Yahoo và Display là traffic từ các banner quảng cáo của Google Display Network hay các ad networks khác. Một số vấn đề về số liệu có thể thường gặp với 2 nguồn traffic này:

1. Khác biệt về số giữa Google Analytics và các hệ thống quảng cáo

Nếu có so sánh bạn sẽ thấy chỉ số đo đạc về số clicks hoặc số conversion giữa Google Analytics và các hệ thống quảng cáo khác thường lúc nào cũng khác nhau, ngay cả Adwords cũng không ngoại lệ. Điều này đôi khi gây khó khăn cho người làm quảng cáo vì không biết chỉ số nào là đúng và vì sao lại phát sinh sự khác biệt như vậy. Sự khác biệt về dữ liệu này thường đến từ sự khác nhau trong cơ cấu tracking của Google Analytics và các hệ thống quảng cáo. Dưới đây là một số nguyên nhân chủ đạo:
– Clicks và sessions là 2 chỉ số khác nhau: các hệ thống quảng cáo thường tính clicks, trong khi Google Analytics lại tính theo sessions. Ví dụ một sessions trong vòng 10 phút của 1 người có thể bao gồm 2 clicks. Adwords có thể ghi nhận 2 clicks nhưng Google Analytics thì chỉ ghi nhận 1 session thôi.
– Cơ chế tracking: Google Analytics thường dựa vào last click để attribute một conversion, trong khi đó thì Adwords và các hệ thống quảng cáo thường sử dụng cookies để xác định một conversion. Ví dụ nếu 1 người click vào banner GDN sau đó lại vào website bằng organic search sau đó mới thực hiện hành vi mua hàng thì lúc này Google Analytics sẽ tính conversion đó cho organic search trong khi đó Adwords lại sẽ tính conversion đó cho GDN.
– Filter clicks: mỗi hệ thống có một cách để filter và chống trùng lặp các clicks khác nhau dựa vào mật độ clicks, IPs, cookies hoặc các yếu tố khác nhau nên cũng có thể dẫn đến sự khác biệt.
– Độ dài ngắn khác nhau trong thời hạn của cookie cũng có thể ảnh hưởng đến sự khác biệt thông số giữa 2 hệ thống.

data-discrepancies.jpg

Khác nhau về số liệu của 2 hệ thống thường đến từ sự khác nhau về cơ cấu tracking. Nguồn: pinterest.com

Giải pháp

Không có cách nào để loại bỏ sự khác biệt về số liệu trong cả 2 hệ thống. Giải pháp thường thấy là lựa chọn một hạn mức khác biệt tối đa hợp lý giữa Google Analytics và các kênh quảng cáo để thống nhất trước khi chạy để tránh vấn đề về thanh toán sau khi kết thúc chiến dịch (nếu làm việc với bên thứ 3).

Xem thêm: Làm sao để tối ưu hóa quảng cáo hiệu quả hơn

2. Một số traffic quảng cáo có thể bị lọt vào referral, direct

Các traffic quảng cáo paid search và display đôi khi có khả năng sẽ bị gán vào nguồn như referral hoặc direct với lý do tương tự như organic search: mất referrer (lý do tại sao referrer bị mất chúng ta sẽ có câu trả lời bên dưới) hoặc do do code tracking UTM bị thiếu, sai.

paid-traffic-to-referral.png

Paid search lẫn display bị lẫn trong nguồn referral. Nguồn: conversion.vn

Giải pháp

Nếu chạy Adwords thì kết nối Adwords với Google Analytics và kích hoạt tính năng auto-tagging, với các kênh quảng cáo khác thì sử dụng URL Builder để gắn code tracking đầy đủ tất cả các đường links quảng cáo dẫn đến website. Lưu ý giải pháp này chỉ giảm thiểu tình trạng trên chứ không giải quyết dứt điểm được.

Referral

Referral về bản chất chứa tất cả những traffic đến từ những domains khác với website đang được đo lường. Do đó trong referral sẽ chứa các nguồn traffic sau: các kênh quảng cáo như banners trên các website, links trên các website khác, các kênh mạng xã hội, emails, bộ máy tìm kiếm và đôi khi traffic đến từ chính các trang trong website của bạn.

referral-traffic.png

Referral lẫn lộn rất nhiều nguồn trong đó. Nguồn: conversion.vn

1. Traffic từ các trang mạng xã hội

Mạng xã hội ngày nay đóng một vai trò quan trọng trong việc mang traffic đến website của bạn và ắt hẳn bạn sẽ muốn phân tích các chỉ số của traffic từ mạng xã hội một cách riêng lẽ. Nhưng hiện nay traffic từ các mạng xã hội nếu không được gắn code tracking một cách đầy đủ thì sẽ vẫn mặc định vào kênh referral hoặc đôi khi direct. Google hiện đang cố gắng phân loại các social traffic tốt hơn tuy nhiên hiện giờ vẫn chưa hoàn hảo được.

Giải pháp

Các links từ các mạng xã hội về website nên được gắn code tracking đầy đủ để có thể dễ tracking hơn. Một số công cụ quản trị mạng xã hội như Hootsuite có tính năng gắn code tracking tất cả các links một cách tự động khi schedule nội dung.

Vào phần Social Settings để add các nguồn Social vào và giúp Google phân loại tốt hơn.

social-settings.png

Thiết lập các kênh social để giúp Google Analytics phân kênh hiệu quả hơn. Nguồn: conversion.vn

2. Traffic từ email trên trình duyệt

Traffic từ email mở ra từ trình duyệt như GMail, Yahoo, Hotmail, v.v… mặc định đều sẽ nằm trong phần referral dù rằng có thể bạn sẽ muốn track các nguồn traffic email này một cách riêng biệt.

Giải pháp

Gắn code tracking cho tất cả các link tới website trong các email để đảm bảo tracking cho traffic từ nguồn này. Một số công cụ gửi email của hãng thứ 3 như MailChimp, BenchmarkEmail có hỗ trợ tự động gắn các tracking code cho các links này.

3. Self-referral

Đôi khi bạn sẽ thấy traffic từ chính domain của mình nằm trong phần referral. Rõ ràng là có gì đó không đúng vì thực chất referral chỉ chứa các URLs từ các domain khác đến website của bạn chứ không được chứa traffic từ các trang trong domain. Việc này có thể khiến cho dữ liệu referral của bạn bị không chính xác. Trường hợp này này thường xảy ra khi:

a. Javascript redirect: nếu bạn vừa migrate website và sử dụng Javascript để redirect domain cũ sang domain mới thì có khả năng sẽ gây ra self-referral.
b. Google Analytics cookies bị mất: nếu vì lý do gì đó mà Google Analytics cookies bị mất trong quá trình chuyển dịch giữa các trang cũng có thể gây ra tình trạng self-referral.
c. Cross-domain: nếu website có nhiều sub-domain ví dụ như abc.com có 1.abc.com và 2.abc.com thì bạn sẽ thấy các sub-domains này xuất hiện trong referral.

Giải pháp

Tất cả các vấn đề trên đa phần đều có cách để giải quyết:

a. Thay vì sử dụng Javascript Redirect thì sử dụng server-side redirect (301) sẽ tốt hơn.
b. Tìm hiểu nguyên nhân xem tại trang nào Google Analytics cookies lại bị mất và tại sao bằng cách vào Behavior > Site Content > Landing Pages và filter source bằng secondary dimension để tìm ra trang đó và kiếm cách giải quyết.
c. Thiết lập cross-domain tracking để tracking traffic dễ dàng giữa các domain với nhau. Hướng dẫn nếu xài Google Tag Manager và nếu không xài Google Tag Manager. Không đơn giản, nhưng cần phải làm.

Direct

Nếu bạn nghĩ rằng các kênh kia là đã lộn xộn thì chắc có lẽ bạn chưa biết bên trong direct có gì. Direct traffic không chỉ là khi người dùng gõ vào địa chỉ website mà còn bao gồm tất cả các nguồn traffic khác mà Google Analytics không xác định rõ nguồn gốc:

direct-traffic-den-tu-dau.png

Câu hỏi lớn trên đầu nhân loại, direct traffic chứa thứ gì trong đó? Nguồn: conversion.vn

1. Traffic từ các trang mạng xã hội

Như đã nói ở bên trên, một phần traffic từ các mạng xã hội cũng có thể bị gộp vào trong mảng direct nếu như các vì lý do gì đó referrer bị mất khi click từ mạng xã hội qua website.

Giải pháp

Chưa có giải pháp nào triệt để vì từ phía bạn có thể add tracking code đầy đủ cho các post trên mạng xã hội của bạn nhưng bạn không thể bắt tất cả followers, fans và những người khác làm như vậy.

2. Traffic từ các ứng dụng mobile

Các click từ các ứng dụng mobile sẽ được đưa vào dạng direct nếu không gắn tracking code đầy đủ. Một phần traffic từ ứng dụng mobile cũng sẽ bị đưa vào direct vì mất referrer.

Giải pháp

Tương tự như social, chưa có giải pháp triệt để vì dù ứng dụng của bạn có được tag tracking code đầy đủ thì không đảm bảo clicks từ các ứng dụng khác cũng sẽ như vậy.

3. Traffic từ các email clients như Outlook

Các links trong các email client như Outlook hoặc Thunderbird nếu được bấm vào sẽ vào phần direct traffic nếu không được tag tracking code đầy đủ.

Giải pháp

Tag tracking code đầy đủ cho các links trong email template.

4. Traffic offline ví dụ như pdf, powerpoint và word docs

Các links trong các documents offline như pdf, powerpoint và file words cũng thường là một phần trong mớ direct traffic.

Giải pháp

Nếu các files đó thuộc quyền của bạn thì nên tag một cách đầy đủ các links với tracking code.

5. Sai campaign code

Các tracking code nếu vì lý do gì đó mà sai (gõ sai, gõ nhầm) sẽ khiến Google Analytics không nhận diện được và các traffic đó cũng sẽ bị đưa vào direct traffic.

Giải pháp

Đừng sai sót khi tạo tracking code. Sử dụng URL Builder để đảm bảo chính xác.

6. Code Google Analytics bị thiếu

Nếu vì lý do gì đó một trang trên website của bạn bị thiếu mất tag Google Analytics thì những traffic đến trang đó và từ trang đó đi các trang khác sẽ bị xem là direct.

Giải pháp

Đảm bảo tất cả các trang đều có tracking code. Có thể dùng ứng dụng như Screaming Frog SEO Spider để check tất cả các trang xem có bị thiếu code hay không.

7. Traffic từ chính bạn

Có thể bạn không nghĩ đến nhưng traffic từ chính team của bạn, công ty của bạn đôi khi cũng có thể gây ảnh hưởng đến mức độ chính xác của nguồn direct. Nếu công ty bạn có 500 người và mỗi ngày mỗi người vào website của bạn một vài lần thì cũng có thể phần nào gây ra sự không chính xác về thông số. Việc này về lâu dài cho thể khiến các thông số của bạn bị chệch đi nhiều.

Giải pháp

Lọc bỏ các traffic đến từ các IPs của mạng công ty. Vào Account > All Filters và tạo new filters để lọc traffic đến từ 1 IPs nào đó. Nếu công ty có nhiều IPs thì phải tạo 1 filter cho mỗi IP đó.

filter-ips.png

Lọc các IPs internal của công ty để data chính xác hơn. Nguồn: conversion.vn

Một số yếu tố khác ảnh hưởng đến tracking của Google Analytics

Ngoài các yếu tố về nguồn traffic được nêu ở trên thì vẫn còn những vấn đề khác ảnh hưởng đến việc thu thập data và tracking của Google Analytics. Hãy cùng xem qua các vấn đề đó là gì:

Javascript disabled = không có data

Google Analytics sử dụng Javascript để thu thập data, cho nên nếu người dùng disable Javascript trên trình duyệt của họ thì lúc này họ sẽ trở nên vô hình với công cụ đo lường này. Theo một nghiên cứu gần đây thì số lượng người disable Javascript khi lướt web hiện đang chiếm khoảng 2,4%.

Giải pháp

Nếu bạn thật sự cố đấm ăn xôi để lấy thêm 2,4% data từ những người dùng disable Javascript này thì có bài hướng dẫn cách để thiết lập tracking cho trường hợp này.

Không có cookies thì cũng không có data

Google Analytics cũng sử dụng cookies để track người dùng hiệu quả hơn. Nếu vì lý do gì đó cookies bị mất (người dùng clear cookies hoặc bị firewall chặn) thì người dùng đó sẽ trở thành một session hoàn toàn mới với công cụ đo lường này.

Giải pháp

Không có.

Referral spam / ghost spam

Referral spam hay ghost spam là các fake traffic được tạo ra bởi các hệ thống spam nhằm đến Google Analytics. Bạn thật sự sẽ không nhận được bất cứ traffic nào từ các trang này, chúng chỉ được tạo ra nhằm hiện ra trong Google Analytics và mục đích là để khiến bạn tò mò và phải mở trong web đó lên xem thử và vô tình bạn đã mang traffic tới cho các trang web này để khiến chúng sinh lời (bằng quảng cáo) hay tệ hơn là nhiễm máy tính của bạn với virus / adware / malware nếu bạn không cẩn thận.

referral-spam-ghost-spam.png

Mục đích của những referrer spam này là khiến bạn mở lên để coi các trang này và vô tình mang traffic tới cho các trang đó. Nguồn: conversion.vn

Giải pháp

Đặc trưng của các nguồn referrer spam này thường là invalid hostname nên chỉ cần thiết lập các filters để lọc các fake traffic đến website của bạn nhưng lại có invalid hostname.

1. Vào Admin > View > Filters > New Filters, chọn Custom > Include > Hostname
2. Điền vào khung filter valid hostname của website bạn dưới dạng RegEx string. Ví dụ website conversion.vn thì sẽ là: ^www.conversion.vn$|^conversion.vn$
3. Bấm verify filters để xác nhận rằng filters này đang hoạt động tốt và Save

Nên kiểm tra lại trong Real Time Report để xem filter này có đang cho traffic đến website hay không.

https://conversion.vn/wp-content/uploads/hostname-filter.png

Filter bằng cách chỉ chấp nhận những traffic có valid hostname. Nguồn: conversion.vn

* Nếu bạn không rành về những phần này tốt nhất nên nhờ kỹ thuật hoặc IT hỗ trợ set up. Và nên tạo View mới khi set up để test thử filters, tránh ảnh hưởng đến data của tài khoản hiện tại.

Xem nhưng mà cũng như không xem

Ngày nay việc bạn mở nhiều website cùng lúc trên nhiều tab của browser và đọc tuần tự là một việc rất bình thường. Người dùng có thể mở website của bạn trên 1 tab và để không trong 10 phút và lúc quay lại thì chỉ đọc nội dung có 30 giây và sau đó thoát ra. Tuy nhiên với Google Analytics thì session đó sẽ được tính là 10 phút 30 giây. Công cụ này không thể phân biệt được việc người dùng hiện có đang đọc cái tab đó không hay là một tab khác.

Giải pháp

Không có.

Nhiều người dùng trên cùng một thiết bị

Hãy tưởng tượng đến phòng net hoặc các máy tính trong thư viện, trường học, một máy tính có thể có nhiều người sử dụng và truy cập và họ có thể truy cập cùng một website. Nhưng với Google Analytics thì tất cả những người đó cũng sẽ chỉ như một người nếu việc truy cập diễn ra trong khoảng 30 phút (hay bất cứ thời gian nào mà bạn set cho công cụ này).

Giải pháp

Hahaha. Không.

Nhiều thiết bị, một người dùng

Ngày nay một người có thể sở hữu nhiều hơn một thiết bị để truy cập vào mạng ví dụ như máy tính bàn, laptop, tablet, điện thoại. Và nếu họ truy cập vào cùng 1 website trên đồng thời 4 thiết bị khác nhau thì đối với Google Analytics, sẽ là 4 sessions và 4 người dùng hoàn toàn khác nhau.

Giải pháp

Cũng không luôn. Tuy nhiên, Google có thể sẽ có giải pháp cho tình trạng này trong tương lai nếu họ có thể kết nối được hoạt động của người dùng thông qua việc logged in vào tài khoản Google trên các thiết bị khác nhau.

Bounce rate cực kỳ thấp?

Nếu một ngày nào đó đột nhiên bounce rate website của bạn giảm xuống còn 1 con số thì cũng đừng vội mừng vì thật ra điều đó là không thể và vấn đề ở đây là có thể bạn đã gắn code Google Analytics lập lại 2 lần trên trang của bạn. Hoặc một trường hợp thứ hai là trang có chèn iframe chứa một trang khác cũng có cùng GA code.

bounce-rate-thap.png

Khoan hãy vội ăn mừng vì có gì đó không ổn ở đây. Nguồn: conversion.vn

Giải pháp

Loại bỏ bớt 1 cái Google Analytics code dư trên website và không gắn iframe chứa 1 trang có cùng code Google Analytics.

Data không phải real time

Một vấn đề nữa từ Google Analytics mà có thể gây ảnh hưởng đến việc phân tích và đánh giá của bạn đó là sự chậm trễ trong việc cập nhật data. Thông thường các data của Google có thể chậm từ 6 – 12 tiếng tùy theo website. Một số section như Search Engine Optimization data có thể chậm đến 48 tiếng.

Giải pháp

Hãy kiên nhẫn.

Data sampling khi quá nhiều traffic

Nếu website của bạn có quá nhiều traffic (từ 500,000 sessions một tháng trở lên cho người dùng free và 25,000,000 cho người dùng Premium) thì có khả năng đôi khi load report của Google Analytics bạn sẽ thấy tình trạng data bị sampled.

data-sampling.jpg

Data sẽ tự động bị sampled nếu website có nhiều traffic. Nguồn: conversion.vn

Data sampled tức là thay vì phải load toàn bộ thông tin sessions của bạn để đưa ra report có thể khiến bạn đợi lâu và tốn thời gian, Google Analytics sẽ tự động không load hết toàn bộ data mà chỉ lấy một phần trong tổng số data và sau đó tính toán để đưa ra chỉ số tương đối. Cho nên nếu có lúc nào bạn làm report rồi hôm sau nhìn lại thì thấy các chỉ số như sessions, conversions thay đổi thì không phải do bạn hoa mắt đâu, mà có thể là do data sampling đấy.

Giải pháp

Bạn có thể nâng cấp lên Google Analytics Premium (150,000 USD / năm) để được export unsampled data.

Tổng kết

Google Analytics là một công cụ đo lường rất tốt và thường xuyên được cập nhật và dần trở nên tốt hơn. Có nhiều vấn đề được nêu ở trên là những thứ thuộc về hành vi người dùng và giới hạn kỹ thuật, cũng có những vấn đề liên quan đến sự sao nhãng do người dùng chứ không hẳn là do Google Analytics. Tuy nhiên tracking traffic có rất nhiều thách thức và các nguồn traffic thì rất là đa dạng và ngày càng phức tạp hơn do đó điều quan trọng là bạn phải hiểu tại sao các công cụ như Google Analytics lại có thể không chính xác và các yếu tố gì gây ra các thứ đó. Điều này là cần thiết để bạn dự trù khi tiến hành phân tích các chỉ số quảng cáo.

Và cuối cùng đừng quên là với các công cụ đo lường như Google Analytics (hoặc bất cứ công cụ nào khác) không phải là “what you see is what you get” (thấy sao thì nó là vậy) mà là “what you interpret is what you get” (bạn diễn giải thế nào thì nó là như vậy). Cho nên cho đến cuối cùng, đưa ra quyết định đúng hay không dựa trên các con số có hoàn hảo hay không vẫn phụ thuộc rất nhiều vào con người.

Nếu bạn có gì muốn góp ý, hãy để bên dưới comment.

Facebook Comments

Tác giả:

Experienced in high level strategy roles. Business consultant, high-profile speaker & key opinion leader, founder of Vietnam's most active marketing community. 10 years experience in digital marketing, customer acquisition & retention, go-to market strategy, programmatic, martech, adtech, etc. Good understanding about technology platforms, especially e-commerce / marketplace, online ride-hailing & delivery.

46 thoughts on “Google Analytics Và Tại Sao Nó Không Chính Xác

  1. Trình viết:

    Rất đầy đủ! Cảm ơn anh Tú 🙂

  2. Ba MiuMiu viết:

    Các bài viết của anh rất chất lượng, có sự đầu tư. Mong anh duy trì phong độ và chúc conversion.vn ngày càng phát triển.

  3. Cub7968 viết:

    ồ bài viết quá tuyệt

  4. Cường Trần viết:

    Không cân phức tạp vậy đâu @.@, những cái thứ nói này giờ đó là kinh nghiệm giành cho người mới thôi còn người có kinh nghiệm thì dựa vào hiệu quả hơn tracffic. Đồng ý việc kiểm tra traffic để đánh giá chiến lược là nguồn từ đâu, và phân bổ làm sao cho hợp lí, nhưng thứ thật sự quan trong gọi là nền tảng cấu thành Digital marketing đó là content cũng là thứ tương tác với người dùng 1 cách tự nhiên nhất, tracffic có nhiều cấp mấy mà không tới được chuyển đổi khách hàng thì cũng vô dụng, analytics nói gì thì nói nó cũng chỉ là công cụ đừng dựa vào nó mà hãy dựa vào trải nghiệm của bản thân.

    Mình sử dụng công cụ chứ không phải công cụ sử dụng mình !

    Có thất bại mới thành công !

    Chúc bạn luôn thành công ^^

    1. Hi Cường,

      Rất cám ơn chia sẽ của bạn. Biết rằng content là thứ tương tác và giúp mang người dùng đến website nhưng nếu mình không tracking, không theo dõi bằng các công cụ tracking thì làm sao biết được là content của mình có tốt hay không? Người dùng dành bao nhiêu thời gian trên đó? Các công cụ tracking còn cho mình khả năng biết được customer journey trên website ra sao, họ xem nội dung gì, qua các trang nào, họ rời khỏi website khi nào, họ đến ở trang nào và họ thực hiện conversion ở trang nào. Những data này rất cần thiết để mình có thể tối ưu hóa thường xuyên và tốt hơn. Trải nghiệm bản thân, Ok, cũng tốt nhưng quyết định nên được đưa ra dựa vào các chứng cứ và lập luận vững chắc hơn là những cái cảm xúc nhất thời.

      Và đương nhiên mình sử dụng công cụ, do đó quan trọng là mình cần biết cách sử dụng công cụ đó một cách hiệu quả hơn bằng cách hiểu rõ những điểm mạnh và yếu của công cụ đó.

      Regards,

  5. Kelly viết:

    Rất cảm ơn bài viết của anh.

  6. moriator viết:

    Bài viết rất hay & đầy đủ. Hi vọng có ngày được trao đổi với anh nhiều hơn 🙂

  7. tuanleanh13 viết:

    Cám ơn anh Tú rất nhiều, rất rõ ràng và chi tiết. Mong anh đem lại nhiều kiến thức cho người làm digital hơn nữa. Thân!

  8. sontinhcamp viết:

    Bài viết rất hay, cảm ơn anh đã chia sẻ!
    Em đã từng mắc vấn đề về nguồn lưu lượng từ các site như float button, chặn đủ kiểu cũng không hết. Thử cách của anh xem sao!

  9. longnguyenminh viết:

    Đọc phê luôn hehe, thanks man.

  10. Rất hay anh Tú ơi 🙂

  11. C.A.TainO viết:

    Cám ơn anh đã chia sẻ, thông tin rất chi tiết.

  12. Ba MiuMiu viết:

    Xin đóng góp với tác giả thêm về ghost spam referral
    https://moz.com/blog/stop-ghost-spam-in-google-analytics-with-one-filter

    1. Thanks bạn. Bài trên Moz giải thích chi tiết hơn về ghost spam cũng như chỉ ra cách giải quyết (cũng giống như mình suggest) là filter hostname.

  13. Sương viết:

    Cảm ơn a Tú nhé! Phải đọc vài lần nữa mới hiểu hết quá 🙂

  14. Duc Tran viết:

    Cảm ơn anh !

  15. GIAONHAN247 viết:

    bài viết thật sự rất là hay, chia sẽ tâm huyết. Cám ơn anh nhiều !

  16. ngan viết:

    Bài viết rất hữu ích cảm ơn vì đã chia sẻ.

  17. do chi nhan viết:

    Cám ơn nhé,bài viết hay quá

  18. Taieuro viết:

    Lượng người newbie nhiều áp đảo!
    Thế mới thấy toàn lời cảm ơn tác giả.
    Chân thành cảm ơn Mr. Tú về các bài viết ^,^

  19. ngan viết:

    Bạn cho mình hỏi một chút là mình đã dùng bộ lọc của GA để lọc Ghost Spam thì bao lâu bộ lọc này sẽ hoạt động nhỉ? Trang của mình hiện đang bị các ghost spam của Alibestsell, get-your-social-button, copyrightclaims bạn có cách nào khác để giải quyết tình trạng này không?
    Cảm ơn !

    1. Hi Ngan,

      Bộ lọc thì thường sau 24h tiếng là có tác dụng ngay. Hãy làm như hướng dẫn set up filter như đã nói ở trên bài viết để chặn.
      Ngoài ra nên tạo view mới backup trước khi apply filter để tránh sai sót.

  20. Minh viết:

    Tks bạn đã chia sẻ. Bài viết rất đầy đủ và hữu ích.

  21. LongNguyen viết:

    Bài viết đc tác giả đầu tư rất công phu, thks tác giả 🙂

  22. letuananhthucuc viết:

    Mình liên kết với Webmaster Tool rồi nhưng thống kê vẫn có sự chênh lệnh giữa hai công cụ >.<

    1. Google Analytics và Webmaster Tool là 2 công cụ khác nhau, cách đo và tính của chúng cũng khác nhau nên số sẽ không giống nhau được. Với lại Webmaster Tool vốn là công cụ để theo dõi và quản lý website, không phải công cụ chuyên đo lường.

  23. TuanKL viết:

    bài chia sẻ thực sự hữu ích và chi tiết. Cảm ơn anh

  24. Tâm viết:

    Nói gì thì nói, mình thấy các anh thật giỏi, có sự cống hiến cho độc giả và các anh thật yêu nghề. Thanks!

  25. delatdecatsini viết:

    Bài này khá hay nhưng thiết nghĩ tác giả nên cập nhật lại 1 chút do giao diện analytic cũng như các menu của nó trong bài viết là cũ rồi, bây h tôi cũng ko thể tìm được những menu này trong phiên bản mới

  26. trung tran viết:

    Mình đang chạy quảng cáo cốc cốc, mình muốn chuyển traffic từ quảng cáo cốc cốc (coccoc_context/CPC) về kênh referral thì làm như thế nào, hiện tại nó tính vào Orther

    1. Bên vào dashboard quảng cáo Cốc Cốc và chỉnh UTM tracking đang có trong quảng cáo từ medium=CPC thành medium=referral là được.

  27. Linh Nguyen viết:

    Website em đang làm có 2 ngôn ngữ là tiếng anh và tiếng việt, trang tiếng việt là subdomain theo dạng vn.example.com.vn. Cả 2 website đang cài chung một ID Google Analytics. Anh Tú cho em hỏi là traffic em đang xem hiện tại sẽ là gộp chung của example.com.vn và vn.example.com.vn đúng không ạ? Em có nên tách riêng ra hai ID Google Analytics không ạ? Cảm ơn anh nhiều!

    1. Hi em, việc dùng chung Google Analytics ID thì yes, nó là gộp chung của các domain, tuy nhiên tùy theo cách em set up nó có thể tạo ra nhiều sessions, users khác nhau. Em đọc thêm bài này ở đây để hiểu cách set up đúng: https://www.lunametrics.com/blog/2016/08/11/subdomain-tracking-google-analytics/

  28. KeniVinh viết:

    Bài rất chất lượng, cảm ơn bạn. Mình tìm đến đọc bài viết này vì đang nghi ngờ nó thống kê không chính xác.

  29. Phan vương triệu quốc viết:

    Mình đang cần 1 bạn chuyên về google analytic. Bạn nào thích thì gọi điện cho mình nhé. Công việc chủ yếu là tư vấn và hỗ trợ. Lương thỏa thuận

  30. Anh Việt viết:

    Cảm ơn tác giả vì bài viết. Có rất nhiều lỗi mình đang gặp phải. Đã hiểu thêm nhiều về Analytics.

  31. Võ Đình Đạt viết:

    Bài viết hay quá anh. Em đã học khóa basic về Google Analytic cuả Google thì sau khi đọc bài này, em hiểu ra một số chỗ em bị tắc không hiểu được. Bài anh viết hay quá.

    Thank you anh Tú.

  32. Thanh Minh viết:

    Giải đáp giúp mình rõ hơn trường hợp người dùng click vào 1 link được gửi trong tin nhắn skype, messenger, zalo… thì được tính sáng traffic của social hay là direct?. Hay tất cả mọi link từ bất kỳ đâu trên mạng xã hội đều dk tính vào traffic của social?

    1. Theo tình hình hiện tại nếu Google Analytics của bạn để mặc định thì Messenger sẽ là referral và zalo thì rơi vào mục other trong traffic category. GA không phân biệt được chính xác các phần này đâu.

  33. Tung Ha viết:

    Cảm ơn bạn vì bài viết bổ ích.

  34. Quân viết:

    Cảm ơn bạn. Site mình còn rất nhiều view hoặc nguồn link (Other) mà không biết từ đâu, số lượng lại nhiều làm nhiều khi phân tích chỉ số không được chuẩn xác cho lắm 🙂

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Name *
Email *
Website