📌강사 소개
전서연님 - 한국인 최초 태블로 앰버서더
패스트 캠퍼스에서 온라인 강의로 유명하신분이다.
📌데이터 시각화와 시각적 분석
📍 데이터 시각화의 필요성
1. 데이터 시각화와 설득의 힘
- 전달하고자 하는 메시지에서 출발 > 시각화를 통한 비교와 평가 > 유저에게 액션을 유도하는 방향으로 설득
2. 시각화의 목적 ( 분석 목적을 명확히 하기 위한 5가지)
- 이걸 보는 사람은 누구인가? : 관리자용/ 실무자용
- 그 사람들이 이걸 왜 봐야하는가? : 비즈니스 어떤 측면을 개선? / 팀의 현재 상황 우선순위/ 예상되는 효과와 비용
- 이를 위해 무슨 지표가 필요한가? : 상대적이고(전주 대비 증감율) / 비율로 표현(재방문율) / 액션 가능한 선행지표(구독 배너 전환율)
- 그래서 어떻게 대응 할 수 있을 것인가? : 비교를 통한 인사이트(비율로 바꿔보고, 전체와 비교하고 비슷한 카테고리와 비교하기)
- 이게 언제 필요한가? : 데이터 시각화 활용 용도에 따른 날짜 집계 단위 변경
📍 Actionable 한 데이터 시각화
1. 대시보드 구조를 먼저 생각하고 적합한 차트 유형 고민하기
- Quick Visibility 를 위해 KPI 증감율과 트렌드는 최상단에
- KPI 에 영향을 미치는 DriverMetrics 와 Input Metrics 로 drill-down / 1 > 2 Depth flow
- 전체적인 데이터 구성이나 흐름을 파악할 수 있도록 OverView 에 퍼널 차트, 트리맵 등 활용 고려
- Action Items 에 넣을 수 있는 것들 : 앞으로 90일간 집중해야 할 영업 기회, CRM 액션이 필요한 고객 리스트 등
- Row-Level 데이터 첨부 및 내보내기 기능으로 유저가 직접 궁금한 부분에 대해 분석할 수 있는 기능 고려
2. 실무에서 쓰는 시각화 차트 유형
대부분 막대, 라인, 도넛 차트 3가지를 표현 할 수 있음
📍기본 차트로 표현이 어려울 때
✔️Sankey Diagram
데이터의 흐름을 단순화해서 보여주는데 효과적임.
✅분석 활용 방안
- 유저 전환의 일반적인 공통 경로 확인 > 유입 경로 퍼널 분석 기반
- 전환에 방해가 되는 요소 확인 > 퍼널 이탈률 개선 인사이트
- 광고 캠페인의 랜딩페이지별 유저 경로 확인 > 캠페인 개선 인사이트
⚠️ 노드가 많거나, 링크의 두께가 비슷한 경우 비교하는데 한계
✔️Gauge Chart
현재 성과 수준의 맥락과 현황 빠르게 확인 가능
✅분석 활용 방안
- 매출 목표와 판매 실적 비교 > 달성률 기반으로 목표 조정
- 유지 관리 비용 모니터링 > 비용 최적화
- NPS(고객 추천 지수) 개선 > 반복적 문제 식별 > promoter 보상
⚠️ 공간 차지 넓음 / 차트에서 성과를 제외한 세부 사항 파악 어려움
✔️Radar Chart
두개 이상의 데이터셋의 평가 항목이 여러 개인 경우 비교에 효과적
✅분석 활용 방안
- 리전별 주요 KPI 비교
- 고객 만족도 비교
- Product 강점 비교
⚠️ 영역의 넓이로 표현되어 실제 값의 차이보다 크게 왜곡 가능 / 배열 순서에 따라 강조되는 포인트가 많이 다르게 보임
📍주제별 실무 시각화 사례
✔️Marketing : 웹 트래픽 분석 대시보드
✔️Marketing : 게임 유저 리텐션 분석 및 이탈 예측
✔️Marketing : 이메일 마케팅 캠페인 KPI 대시보드
✔️Product : Feature- Product fit
✔️Growth : Aha Moment Dashboard (아하! 모먼트)
✔️Growth : Churn Probablity Analysis
📌방법론
📍 인사이트 도출 방법론
- 데이터 시각화를 활용한 인사이트 도출 Flow
현상 ➡️ 평가 ➡️ 원인 후보 ➡️ Drill Down 시각화 ➡️ 데이터 스토리텔링(시각화)
1. 지표 평가하기
- 지표 집계 : 합계, 평균 등 데이터에 적합한 집계 방식
- 비교 대상 : 유사 카테고리 / 전체 평균/ 이전 동일 기간 대비 등 비교에 적합한 대상 (전체 카테고리 평균 매출 대비 A 카테고리 매출)
- 비교 시각화
1) 📈라인차트(추이)
ex)
2) 📊막태 차트 (편차, 양)
ex)
3) 🍩 비율 막대 차트, 도넛 차트 (구성비율)
ex)
** 평균의 함정
평균값만 보고 평가하기 섣부른 데이터가 많다.! (데이터 분포 확인 필수)
2. 원인 후보 나열하기
지표에 영향을 준 원인 탐색(Metric Hierachy, user Funnel)
3. Drill Down 시각화
- 시간에 따른 변화
- 그룹 쪼개기
- 이상치 확인
- 경향성과 상관관계 파악
4. 제품 데이터 바깥의 맥락 보기
- 밀크셰이크 스토리처럼 유저를 관찰 하면서 인사이트 얻고 제품 개선에 반영
- 원인은 하나가 아닐 수 있으니 외부 상황에 대한 관찰도 필요
📍분석가 실무 커뮤니케이션 프로세스
분석 범위 설정 ➡️ 인사이트 도출 ➡️ 관계자 리뷰 ➡️ 분석 결과 다듬기, 데이터 시각화 ➡️ 분석 결과 배포
1.분석 범위 설정(Analysis Scoping)
- kick-off Meeting : 이해관계자들과 컨텍스트 파악으로 비즈니스목표, 초기가설, 실험(실험 디테일 확인), 결과 리뷰
- 가설 수립 : 가설 수립후 각 가설에 대한 대응방안 브레인스토밍
- 분석 scope 정하기 : 가설 확인을 위한 지표 선정
- 우선순위 및 타임라인 : 고려사항 ( 비즈니스 우선순위, 긴급성/기한, 영향력/가시성, 효율성/리소스 가용성)
2. 인사이트 도출 (Data Exploration)
- 데이터 체크 : 데이터 기본 정보확인, 결측치 확인, 이상치 탐지, 중복값 확인, 숫자형 변수 통계 분석, 범주형 변수 빈도 분석
- EDA & 데이터 시각화 & 인사이트 도출 (지표 시각화)
3. 관계자 리뷰 (Stakeholder Check-in)
- 관계자들 중간 리뷰 ( 1차 분석 결과 검토 > 피드백 & Iteration)
4. 결과 다듬기 시각화 (Analysis Polish)
- 피드백 반영
- 데이터 시각화로 분석 결과의 핵심 추출
- 인사이트를 제안으로 연결
5. 분석 결과 배포(Analysis Distribution)
- 분석 결과 Doc 배포
보고서에 포함되어야 할 내용들(개요/핵심요약/세부정보/인사이트/한계점/Next Step 제안/ Action Items)
- Cross-Functional 팀에 분석 결과 PT
효과적 커뮤니케이션 방법
1) 기술적인 용어 최소화 (청중의 언어로 설명하기)
2) 간결하고 명확하게, 핵심 메시지
3) 데이터를 이야기로 풀어서 전달
4) 이해관계자들로 부터 어떤 피드백을 받았는지 전달
5) 분석 결과의 한계 및 불확실성에 대한 인정 및 설명
6) PT 이후 Q&A 세션 > 더 나은 이해에 도움이 될 수 있도록
📍좋은 차트를 만드는원칙
1. 어떤 차트를 써야 하는가
목적에 맞는 차트 유형 선택
1)변화
- 라인차트
- 컬럼 차트
- 영역 차트
- 비율 바 차트
- 도넛 차트
2)비교
- 바 차트
- 그룹 차트
- 히트맵
- 상관관계
- 산점도 (scatter plot)
⚠️ 3D차트는 쓰지 않음, 시간의 축은 X축이 기본,
2. 어떻게 차트를 써야 하는가
- 중요한 정보만 : 데이터 잉크 비율 최대화, 노이즈 최소화
- 차트 내용을 설명 : 자세히 보지 않아도 의미를 알 수 있는 텍스트 함께 제공
- 다양한 관점에서 시각화 : macro/medium/micro level
3. 차트 디자인 시스템
- 차이를 강조하기! : 서로 다른 지표를 나타낼 경우 텍스트 뿐만 아니라 색상을 다르게해야함
- 게슈탈트 원칙 고려 :
1) 근접성 : 함께 있는 개체를 그룹으로 인식하는 경향
2) 공통성 : / 공백을 기준으로 서로 다른 역햘의 뷰 구분 (오버뷰, 드릴다운)
3) 연속성 : 연속적으로 정렬된 객체를 같은 그룹으로 인식
4) 유사성 : 유사한 색상,모양,크기, 방향을 갖는 개체를 그룹으로 인식하는 경향
( 프로모션 기간은 초록색, 비교기간지표는 회색으로 그ㅜ분)
'성동 1기_ 모빌리티 전Z전능 DA' 카테고리의 다른 글
모빌리티 산업 그리고 물류 이야기 (0) | 2023.12.13 |
---|---|
디자인 스프린트2 DAY1 (0) | 2023.12.13 |
Python 그래프 만들기 - Matplotlib, seaborn (0) | 2023.12.01 |
Python 기초 (6)- 결측치 처리,이상치처리,기준값 찾기, dropna, isna,IQR (0) | 2023.11.30 |
Python 기초 (3) - 함수, 데이터프레임,어트리뷰트, 매서드, 데이터 분석 기초 (0) | 2023.11.29 |