로그 설계/수집/관리/분석을 현업 전문가의 슬라이드를 참고해 정리합니다.
(서비스) 로그 : 이벤트에 대한 기록, 유저의 행동에 대한 기록
- 로그 예시
123.65.150.10 – – \[23/Aug/2010:03:50:59 +0000\] “GET /my\_homepage HTTP/1.1” 200 2262 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +[http://www.google.com/bot.html](http://www.google.com/bot.html))”
- 이벤트 : 유저의 회원가입, 로그인,로그아웃, 결제, 쿠폰획득
1. 로그 설계와 정의
- 데이터 관계자(지표를 보는 사람들, 분석가, 개발자) 의견을 종합한 로그 설계
- 이벤트 정의
2. 로그 수집
- JSON 형태로 저장된 데이터 (key:value)
- 저장소 접근 및 데이터 추출/분석 환경 세팅 (스키마 설계)
- 고려할만한 요소
- 메타데이터 : 서비스를 구성하는 정보에 대해 식별자와 그 상세정보가 매핑된 데이터로 정적 데이터양이 많고, 로그 목표에 필요하지 않은 경우 메타데이터 사용.
- Context Identifier 문맥식별자 : 하나의 행동으로 일어난 로그들이 같은 식별자를 가지도록 함으로써 인과관계/선후관계 파악에 도움을 줌.
- Unique Identifier 고유식별자 : 고유 식별자를 가지도록 하여 중복 로그 식별 및 분석(특정 로그를 기준으로 잡을 때)에 도움을 줌.
3. 데이터 품질 관리(완전성 검토) 및 문제 해결
서비스가 성장할수록 이벤트/항목의 증가하기 때문에 지속적으로 변경 혹은 특이사항 발생할 수 있다. 문제 상황이 발생하기 전에 데이터품질 관리 차원에서 다음의 task를 수행한다.
- 의도한 시점에 의도한 형태로 정확한 값이 로깅되는 지 테스트
- 서비스 구성요소별 로그 관리
- 로그 문서화
4. 로그 분석
로그 데이터 분석에 앞서 다음의 사항들을 고려한다.
- 유저의 행동을 효과적으로 잘 설명할 수 있는가?
- 분석 프레임 (목적 및 질문 선정) 설정 후 분석
- 집계할 지표에 대한 고민
Reference/Source : https://speakerdeck.com/devinjeon/jamag-ndc19-joheun-rogeuran-mueosinga-joheun-rogeureul-wihae-goryeohaeya-hal-geosdeul, https://www.brainlabsdigital.com/marketing-library/the-complete-guide-to-log-analysis-with-big-query/
'Data Science > Product analytics' 카테고리의 다른 글
[Paper Review] 링크드인 사례 - Detecting interference: An A/B test of A/B tests (0) | 2021.08.11 |
---|---|
[데이터 분석 실무] 고객 리텐션 분석 (Spark SQL) (0) | 2021.04.02 |
[ 데이터 분석 실무 ] A/B Testing (0) | 2021.03.26 |
[데이터 분석 실무] 웹 퍼널 분석 (Bounce Rate, Conversion Rate) - MySQL (0) | 2021.03.26 |
[데이터 분석 실무] Cohort Analysis, 코호트 분석 Python (0) | 2021.03.20 |