웹분석 도구의 분류
웹분석 도구의 정의에 따라 살펴본다면, 반드시 ‘로그분석 솔루션’이라고 불려지는 제품들만 웹분석 도구에 포함되는 것이 아니라, 다양한 분석방법을 이용한 것들이 웹분석 도구에 포함될 수 있게 된다.
작게는 특정 웹페이지의 hit수를 측정하는 카운터부터, 크게는 eCRM의 DW에 사용될 복잡한 데이터를 수집하여 제공하는 솔루션까지 그 범위는 매우 넓다.
일단은 eCRM 중 분석CRM의 범위를 넘어가지 않는 수준에서 웹분석 수준, 웹분석 방법에 따라 정리하도록 하자.
웹분석 수준에 따른 분류
웹분석 도구의 측정 수준에 따라 아래와 같이 나누어 볼 수 있다.
1. 단순 측정도구. (예: 홈페이지 히트 카운터)
2. 측정결과를 여러 형식으로 표현하는 도구. (예: 접속통계 )
3. 복잡하고 다양한 측정요소에 대해 데이터를 수집 및 리포트 생성하는 도구. (예: 기본 웹로그분석기)
4. 현업에서 요구되는 다양한 분석을 수행하기 위해, 웹측정 결과를 가공하고 필터링하여 유연한 리포트를 생성할 수 있는 도구. (예: 측정지표를 정의하고, 리포트를 설계, 타겟값을 관리하는 기능 등 )
5. 웹분석결과와 e-Business의 다양한 측정결과( 매출, 회원참여, 마케팅효과등 )을 연계하여 보다 수준 높은 리포트를 생성할 수 있는 도구. (예: 회원ID의 추출기능, Back-Office/MIS 시스템과 연계된 분석 등)
6. 수준 높은 웹분석결과와 연관 e-Business 솔루션과 연계하여 자동화된 온라인 마케팅 최적화 수행. – 이 단계는 분석CRM단계를 넘어서며 eCRM의 Marketing Automation 분야에 해당한다. (예: 웹분석과 메일발송, 웹분석과 CMS, 웹분석과 개인화엔진 등의 유기적 연결이 가능한 Platform화)
웹분석을 위한 데이터 수집 방법 별 분류
웹분석 도구는 데이터 수집의 방법( 좀더 정확한 표현으로는 웹분석을 위한 Data Source)에 따라 크게5가지로 나누어 살펴볼 수 있다.
4 웹서버 로그파일(Server Log File Analysis) 분석방식
- 웹서버가 생성하는 로그파일을 파싱(Parsing)하여 데이터를 수집하는 방식이다.
- 1993년 GetSites을 시작으로 웹로그파일 분석방식의 제품들이 등장하기 시작하였다.
- 지금까지도 널리 사용되는 기본적 데이터 수집방법이다.
- 별도의 로그데이터를 수집하여, 원격지의 분석서버로 전송하는 모듈을 이용하여 ASP(Application Service Provider)형태로의 서비스도 가능하다. 하지만, 페이지태깅방식이 등장하면서 ASP서비스는 대부분 사라졌다.
4 패킷 스니핑(Packet Sniffing) 방식
- 네트워크의 패킷(주로 HTTP통신패킷)을 잡아내는 Packet Sniffer를 이용하여 데이터를 수집하는 방식이다.
- 1996년경부터 사용된 데이터 수집방법이지만, 세계적으로 봤을 때 웹분석을 위한 데이터소스로 많이 사용되지는 않고 있다.
- 대규모의 페이지와 트래픽을 갖는 웹사이트에서, 로그파일 생성 및 페이지태깅이 힘들 때 선택되는 경우가 많다.
- 보안탐지 솔루션과 기본적인 Sniffing 방식은 동일한 까닭에 보안위협요소, 침입탐지등의 이슈와 연계한 분석들이 가능하다.
- 네트워크단에서 데이터를 수집하므로, 기존 로그파일분석 방식에서 불가능한 여러사항들에 대한 측정이 가능하다.
ž 다운로드 중 취소되는 비율과, 취소되는 시점
ž 어떤 컨텐츠 전송 중 사용자가 브라우저의 STOP버튼을 클릭하는지
ž 서버 반응시간대별 방문자의 반송율
ž 실행시간/페이지 로딩시간이 가장 느린 페이지 추적
- 대용량의 트래픽을 갖는 웹사이트의 경우 네트워크 패킷을 캡쳐하여 측정하기 위해서는 상당히 높은 사양의 시스템 장비가 필요하다.
- 최근 웹서비스 동향과 같이, 하나의 웹사이트가 다수의 CP(Contents Provider)로 구성된다거나, 다수의 웹서버가 네트워크적으로 분리되어 서비스된다거나, CDN(Contents Delivery Network)와 같이 외부의 컨텐츠 전송서비스업체를 이용한다거나 할 경우 분석이 불가능 할 수 있다.
4 페이지 태깅(Page Tagging) 방식
- 웹페이지에 데이터를 수집하는 객체를 삽입(Tagging)하여 데이터를 수집하는 방식이다.
- 1997년 JavaScript에 의한 페이지태깅 방식의 제품이 선보이면서 현재까지 가장 빠르게 성장한 분석방법이다. JavaScript 뿐만 아니라 Flash객체등도 이용될 수 있다.
- 웹사이트를 구성하는 컨텐츠/서버/제공자/네트워크구성에 무관하게 데이터를 수집할 수 있고, 자동적인 통합(Merge)분석이 수행되는 장점이 있다.
- 위와 같은 장점으로 인해 ASP(Application Service Provider)/SaaS(Software As A Service)형태로 많이 이용된다.
- 페이지 태깅방식은 세부방법 별로 4가지의 방식으로 나누어 볼 수 있다.
.
ž 웹페이지내에 Web Beacon 또는 Web Bug라고 불려지는 1x1 pixel의 작은 투명이미지를 삽입하여, 데이터를 수집하는 방식.
대규모의 웹페이지 제공으로 인해 로그파일을 생성량이 많아서 일반 웹로그분석을 통해 분석이 원활하지 않을 때, 주요 특정페이지들을 중심으로 분석하고자 할 때 많이 이용되었다.
현재는 JavaScript실행을 제한하는 웹메일로 조회되는 메일컨텐츠 추적등을 위해 사용되고 있다. 최근에는 스패머(Spammer)들이 무작위로 발송하는 웹메일 컨텐츠의 노출여부등을 통해 실제 존재하는 메일주소 여부등을 판단하기 위해 악용되는 것으로 인해, 웹메일 서비스에서 외부 이미지에 대한 표현을 막는 경우가 많아 예전보다 활용성이 낮아졌지만, 아직 유용한 방법으로 평가받고 있다.
데이터를 수집하는(이미지를 제공하는) 서버/네트워크의 장애시 웹페이지의 로딩에 장애가 발생할 수 있는 단점이 있다.
ž 동적 웹페이지를 생성하는 서버측 프로그램내에 파일 또는 DB에 측정내용을 저장하는 작은 프로그램 또는 함수를 포함하도록 하여 데이터를 수집하는 방식.
사용자에게 웹페이지가 보여지지 않는 내부 프로그램(Form Action이 발생하는 페이지) 의 요청횟수, 요청내용 등을 기록하고 분석하기 위해 사용되었다.
일반 페이지에 대한 분석에서는 MS사의 IIS 웹서버의 Global.asa 객체의 특징을 이용하여 데이터 수집에 활용하는 사례가 많았다.
최근에는 RIA(Rich Internet Application)이 많이 사용되면서, XML데이터만을 제공하는 웹페이지의 수가 많아졌고, 이러한 요청에 대해 로그를 별도 생성하기 위해 사용되는 경우가 많다. 이를 위해 웹분석솔루션에서 데이터를 별도로 수집하기 위해 API등을 제공하기도 한다.
Loadable Module/API 등을 이용하여 웹서버 또는 웹애플리케이션, 동적 웹페이지를 생성하는 프로그램내 삽입하여 데이터를 추출하는 경우에는 API에 의한 방법으로 별도 분류되기도 한다.
ž 웹페이지에 스크립트를 삽입하여 분석에 필요한 데이터를 수집하는 Script Embedding 방식.
WAS(Web Application Server, 일종의 웹서버로 이해해도 무방함)등을 이용한 웹서버에서 적절한 로그파일을 남기기 힘들거나, 로그파일을 입수할 수 없는 파트너사의 웹서버에서 제공되는 웹페이지를 분석하거나, 다양한 호스트명의 분할/로드밸런싱에 의한 로그파일의 분할이 많은 경우 자동적인 Merge(통합)분석 효과를 얻기 위해 사용되는 경우가 많았다.
현재 Page Tagging 방식 중 가장 많이 사용되는 방법이다.
ž 플래시(현재 Adobe Flash) 객체를 웹페이지에 삽입하여 분석에 필요한 데이터를 수집하는 방식.
Flash를 이용한 카운터개발이 그 시초이다.
JavaScript를 제한하는 경우가 많은 웹메일 서비스의 메일컨텐츠, 온라인 RSS리더서비스(예: 구글리더)내 컨텐츠, JavaScript 코드입력을 제한하는 UCC컨텐츠(미니홈페이지, 오픈마켓 상품설명페이지)에 대한 간단한 통계를 얻고자 할 때 응용되는 경우가 있다.
내부 액션스크립트 활용에 따라 다양한 방법으로 응용이 가능하다.
4 하이브리드(Hybrid) 방식
- 앞서 설명된 3가지 방법 중 2가지 이상의 방법을 함께 이용하는 분석 방식이다. 예를 들어 데이터 전송량 및 다운로드 분석은 로그파일을 이용하고, 방문자의 세션 수와 같이 페이지 태깅이 유리한 방식은 해당 방식을 이용하는 것이다.
- 세계적인 업체들은 상당수 Hybrid 방식을 제공하고 있다.
- 요구되는 모든 분석사안에 대해 정확한 분석을 할 수 있는 장점이 있다.
- 특정 한가지 방식을 쓸때보다 분석 시스템이 복잡해지고 비용이 증가하는 단점이 있다.
4 패널(Pannel)에 의한 방식
- 인구통계학적으로 샘플링된 소수의 인원에게 어떠한 웹페이지를 브라우징 하고 있는지에 대한 정보를 전송하는 브라우저 Plug-In 또는 Toolbar 등을 설치하도록 하여 데이터 수집서버에서 취합한 후 리포트를 생성하는 방식.
ž 트래픽이 많은 웹사이트의 경우, 그렇지 않은 사이트보다 상대적으로 실측에 가까운 측정결과를 얻을 수 있다.
ž 타 웹사이트와의 유출에 대해서도 분석이 가능하다.
ž 분석대상 웹사이트외 경쟁웹사이트와의 비교분석이 가능하다.
ž 실측을 위한 리소스(Software/Hardware/Network비용)이 상당할 경우, 본 방법이 경제적으로 빠르게 측정결과를 산출할 수 있다.
ž 샘플링된 패널선정에 오류가 있을 경우 큰 데이터의 왜곡을 가져온다.
- 대표적인 업체로서 국내에는 Korean Click, Metrix, Rankey 등이 있으며, 해외에는 Alexa, ComScore 등이 있다.
출처 : http://cafe.naver.com/bizspring