어제 내용 정리
분석이란? 분석은 비교다!
비교는 쪼개서 하는것이다.
📌데이터 분석 2
그럼 비교는 어떻게 할까?
육하원칙에 의해 누가? 언제? 어디서? 무엇을? 어떻게 ? => 이런 데이터로 분석을 하는데
위 육하원칙이 메트릭이 된다.
📍메트릭이란?
데이터 목표 수립 가이드
-
측정에 사용된 측정 척도 및 기법. 정상적인 데이터를 분류하는 기법도 포함된다. ⇒규범 표기는 미확정이다.
- 네이버 국어사전
데이터에서는 성과나 사용자 데이터를 바로 보기 편하고 분석 가능한 형태로 변환ᐧ요약한 숫자를 말한다.
특히 active user ratio (사용자 활동 비율), 구매 전환율, 결제횟수, 평균 방문 횟수 등
서비스를 운영하면서 모이는 데이터들을 METRIC 라고 한다.
SaaS (소프트웨어 서비스 - 구독이나 월결제)
주로 무료에서 유료로 전환하는 비율 필요하고
로그인후 결제하는 과정, 해지하거나 다른 서비스로 가는 고객 live time value(LTV)를 메트릭 지표로 본다.
📍Nort Star Metric - 북극성 지표
고객이 서비스나 제품을 통해 얻게 되는 핵심 가치를 정확히 나타내는 지표
[출처] 북극성 지표, OMTM, 지표의 뜻, 특징, 공통점과 차이점|작성자 테크보스
조직의 목표와 방향 그리고 성공을 가늠하는 숫자,
‘북극성’을 보며 항해하는 배의 방향과 위치를 알 수 있듯
회사의 현 상황을 정확히 파악할 수 있게 하는 숫자를 ‘북극성 지표’를 봐야한다.
그렇다면 넷플릭스의 북극성지표는 무엇일까?
➡️ 고객의 시청시간을 늘리는것!
하지만 북극성 지표에 영향을 주는 선행 지표(Input Metrics)를 찾아 선행 지표를 개선해야 함
= 너무 많다.
그래서 나온것이 OMTM ! 하나의 지표를 골라 인사이트를 도출하자.
📍OMTM - One Metric That Matters
가장 중요한 단 하나의 지표이다.
북극성 지표와 + 그 외 회사의 중요 지표들을 일정기간 추린다.
이 둘간의 상관관계 매트릭스를 그려본다.
그 중에서 매출과 가장 연관관계가 높은 지표를 선정한다.
여러 후보 중에 더 많은 유저가 데이터 포인트를 남기는 지표를 택한다.
= 상관 분석 하자
우리의 노력으로 개선할 수 있는가 & 조직의 방향성과 맞는가
📍상관분석
상관분석은 서로 연관되어 있는지 분석하는것이다.
예를 들어 고객이 구매를 할때 영향을 끼치는것 중 1. 장바구니 2. 가격 이 있을것인데
구매와 이 2가지가 연관이 있는지 확인하는것이 상관분석이다.
Ex. 페이스북 포스팅의 좋아요와 공유 수
✔️ 현재 서비스중인 사업들을 통해 본 상관분석
브랜드 | 목표 | 출처 : 텍스트북 인터뷰 | ||
마켓컬리 | 고객만족도 : 전체 매출 중 기존 고객 매출 비중이 90% 이상 |
만족도 높은 상품 지속 공급 |
신규 상품 공급 | 고객 여정 최적화 |
WISLEY | LVT: 구독모델이기에 앞으로 고객이 가져올 가치가 중요 |
Net Promote Score |
신규 구독자 수 |
|
WATCHA | 유료구독자 | 잔존율(재구매) |
활성사용자 (Active User) |
신규무료전환율 |
📍AARRR (단계별 매트릭)
A: Acquisition (획득) - 고객을 데려오는것 (CAC, CPM, CPC, PV, UV, 세션, 앱설치)
A: Activation (활성화) - 고객을 쓰게 하는 것 (AU, 체류시간, 이탈률, 구매전환율, 취소율)
R: Retention (재사용) - 고객이 또 쓰게 하는것 (N일-재사용율, 재구매율)
R:Referral (추천) - 주위에 입소문을 내는 것 (공유수, 앱랭킹, 만족도, 평점)
R: Revenue (이익) - 수익을 내는 것 (LTV, ARPU, ARPPU, ROI)
📌가설수립 실습
카페 3년간 판매데이터를 가지고 가설 만들어 보기
1. 프로모션 기간을 토대로 프로모션 할 때와 안했을 때의 판매량 비교 => 프로모션 기간이 너무 적었지만 스무디의 판매량이 급 늘었음
2. 스무디 판매량이 늘었으니 스무디가 잘팔리는 여름에 프로모션을 하면 효과가 더 좋지 않을까?
➡️ 월별로 나눠보니 여름에 판매량이 더 늘은것은 맞음
3. 주말에 많이 먹을 확률이 높다.
➡️ 실제 주말 판매량이 높았음
4. 평소에는 인기가 없지만 프로모션 기간에만 많이 팔리는 음료나 디저트가 있을까? 프로모션 진행 시 해당 제품 수량을 늘리고, 해당 음료 프로모션 강화하자.
➡️ 스무디가 가장 많았으니 일리가 있다.
📖 미션 1
여름철, 가을, 겨울에 대해서 요일로 쪼개고, 기준쪼갠것으로 계절별로 나눠서 피봇테이블에서 메뉴별 평균 판매량을 계산해보기
가정 11~2월 겨울 3~5 봄 6~8 여름 9 ~ 11 가을로 본다.
✔️응급실 실려온 데이터를 가지고 가설 세워보기
1. 더 다치는 시간대는? (데이/나이트) 각각 비율은?
남자 비율이 높고 저녁때 응급실에 온 비율이 높음
2. 데이터 측정 이후 분기별 부상자 발생 추이는?
1분기, 2분기에 많이 발생함 날씨가 좋은 2분기에 많이 발생하는것으로 보임
3. 많이 다치는 요일은? 각각의 비율은?
남자는 화,금 여자는 주말
4.부상자 나이를 20미만, 20~29, 30~39, 40~49, 50+ 로 구분해
가장 많이 다치는 나이는 30,40대이다.
(언제 가장 많이 다치는지 분석도 진행해봤음)
나의 인사이트는
남자의 비율이 높고 밤에 많이 가며,
특히 1,2분기의 비율이 높고
가장 많이 다치는 나이는 30,40대이다.
보통 회사원인 30,40대 남자들이 평일에 회식을 하는중(마치고) 다치고, 여자는 주말에 약속이 많아 다치는것 같음
📖 미션 2 (sheet 2개를 합쳐서 진행)
- 낮-밤 다치는 비율의 차이가 가장 적은 부위는?
back/ fall- 연령별로 가장 많이 다치는 부상은?
20미만, 20~29, 30~39, 40~49, 50+10대는 Abdomen20대는 머리/ 등 30대는 등 /멀티플 40대는 feet 50대는 다리 - 나이와 부상은 연관이 있는지?
- 성별-연령-시간대를 전부 고려해 가장 부상이 많이 발생하는 경우는?
📍상관관계 분석
다 양의 상관관계가 있다고 보이지만 실제 원인과 결과를 찾는것은 매우 어렵다.
📍인과관계 - 데이터 분석은 결국 인과 관계를 찾아 결과를 개선할 방안을 찾는것
상관관계를 찾은 뒤, 실험을 통해 원인 -> 결과를 파악해 보는 것도 방법
1. '우연의 일치'는 아닐까?
갑자기 서울 관광객수가 늘었는데 왜 였을까? = 환율? ❌ 입국규제완화? ❌ ➡️ BTS의 인기로 "성지순례"옴
2. 또다른 변수는 없을까?
3. 역 인과관계는 없을까?
📍대푯값 - 평균의 이해
집단 또는 데이터를 대표하기 위해 계산하는 값, 전체 데이터의 특징을 보여 줌
- 평균 : 가장 많이 쓰이나 극단적인 값이 계산에 영향을 미침 ex) 70점,80점, 76점, 20점 평균61.5점(average)
- 중앙값: 가장 중앙에 있는 값 (Median)
- 최빈값: 가장 많이 존재하는 값 (mode)
데이터 분석의 함정을 주의할것 !
엑셀로 사용하는 데이터 분석은 처음이라 서툰부분이 있었지만 피봇테이블 아주 착한 친구다.
특정 데이터를 조회하지 않아도 Drag & Drop 으로 데이터 분석을 할 수 있다니..
다만 아직은 파이썬이 익숙한 나라서 좀 더 연습이 필요할 듯 하다.
엑셀 만랩 가자 화이팅!!!
#청년취업사관학교 #데이터분석가 #데이터분석가부트캠프 #DA교육 #데이터분석교육 #실무프로젝트 #실무경험 #취업포트폴리오 #포트폴리오 #취업연계교육 #코멘토 #모비니티
'성동 1기_ 모빌리티 전Z전능 DA' 카테고리의 다른 글
Day 14 - GA4 데이터 수집 초기 환경 구성 & 데이터 분석 (1) | 2023.11.02 |
---|---|
Day 13 - 데이터 분석 (엑셀3 / 데이터 클렌징) (0) | 2023.11.01 |
Day 11- 데이터 분석 (엑셀/ 기초 함수) (2) | 2023.10.30 |
Day 10 - 디자인스프린트 마지막 (발표) (0) | 2023.10.27 |
Day 9 - 디자인스프린트(고객인터뷰 준비부터 결과까지) (0) | 2023.10.27 |