티스토리 뷰

 

 


 

 

[구글애널리틱스_#13] 가짜 트래픽 제외하기

 

이 글은 가짜 트래픽 제외와 관련된 정보를 포함하고 있습니다.

 

  가짜 트래픽이란?

 

가짜 트래픽은 'Ghost referrer spam'으로 스패머가 광고 목적으로 타인의 웹사이트에 가짜 추천 URL을 사용해 반복적인 웹사이트 요청을 하는 것입니다. 광고 목적으로 생성된 트래픽이기 때문에, 이탈률이 높은 편이며 잘못된 수치로 보고서를 분석하는 것을 방해합니다. 이는 객관성을 떨어뜨리는 자신 또는 자사에서 유입된 트래픽과 비슷하지만, 수치에 부정적인 영향을 끼친다는 것이 특징입니다.

 



 

 

  가짜 트래픽 확인하기

 

가짜 트래픽을 제외하기 위해서는 가짜 트래픽이 어떤 것인지 확인해야 합니다. 

가짜 트래픽은 [획득]-[전체 트래픽]-[추천]에서 확인할 수 있습니다.



[추천보고서]에서 두 번째 측정기준을 '호스트 이름'으로 변경합니다.

위와 같이 '호스트 이름'이 나타나게 됩니다. 가짜 트래픽은 '호스트 이름'을 통해 알 수 있습니다. 만약 호스트 이름에 (net set)이 나타날 경우 해당 트래픽은 리퍼러 스팸으로 발생한 가짜 트래픽으로 간주할 수 있습니다. 또한, 소스명이 'idea.com'일 때, 호스트 이름이 'ldea.com'와 같이 비슷한 모양의 문자로 꼼수를 쓴 트래픽 또한 가짜 트래픽으로 간주할 수 있습니다. 이런 트래픽의 경우, 해당 페이지에 접속하면 자신의 웹사이트에 대한 링크가 없는 것을 확인할 수 있습니다. 저와 같은 경우 모든 호스트명이 제 주소로, 제가 쓴 글을 통해 유입되었으며 가짜 트래픽이 없는 것을 알 수 있습니다. 


다시 정리해보면, '호스트 이름'이 (not set), i와 l과 같이 비슷한 문자로 표시된 리퍼러가 가짜 트래픽입니다.



 

 

  가짜 트래픽 제외하기

 

호스트 이름을 통해 가짜 트래픽을 보내는 도메인을 알아냈다면, 이제 해당 도메인으로부터의 데이터를 제외해주어야 합니다.

해당 도메인은 [관리]-[보기]-[필터]에서 제외 필터를 통해 제외시킬 수 있습니다.




[새 필터 만들기]를 클릭하고, 필터 이름에는 필터를 구분할 수 있는 이름을 설정합니다.

필터 유형을 '제외'로 선택합니다.

[제외]-[필터 입력란]을 '추천'으로 설정합니다.

[필터 패턴]에서는 자신이 제외하려는 도메인을 넣어줍니다.

정규 표현식을 활용해 여러 도메인을 제외할 수 있습니다.


ex)


marketingbr.tistory\.com|tistory\.com


해당 패턴에서 사용된 정규식은 '\'와 '|'로, '\'은 다음에 입력된 '.'이 정규식에 포함되기 때문에 해당 문자를 정규식이 아닌 일반 문자로 표기하기 위해 사용합니다. '|'은 'OR'을 뜻하며, 앞의 도메인이 아니라면 뒤의 도메인인지를 확인하는 것을 뜻합니다.


정규식에 대해 더 궁금하신 사항이 있으시면, 아래의 링크를 클릭해주세요.


정규 표현식 정보_google

 




최근에 올라온 글
최근에 달린 댓글
방문자수
  • Total :
  • Today :
  • Yesterday :

마대생의 마케팅 공부 기록 마대생이 보는 세상