Day 13
데이터 읽기와 가시화 프로세스
오늘 배울 부분은 데이터확보와 데이터처리 부분
데이터 저장 ➡️ 가설 수립 ➡️ 데이터확보 ➡️ 데이터처리 ➡️ 가시화 ➡️ 인사이트 도출
데이터는 모아져 있어야 서로 비교하거나 특징을 끄집어 낼 수 있음
➡️데이터는 모아야 분석이 가능함
1. 데이터 확보
데이터는 언제부터인가 DB(데이터 베이스)로 모으는 사람들이 규칙을 만들기 시작했다.
데이터를 여러명이 보고 각자 사용하기 때문이 아닐까 ? 생각한다.
주로 행(Row)는 필드라고 하고, 열(Columns)는 레코드라고 한다.
데이터 베이스를 만들 때 주의할 점!
1. 가급적 하나의 시트의 몰기
2. 첫 행은 반드시 필드 명을 작성하기
3. 데이터는 아래로 작성
4. 빈행, 빈열 없이 작성하기
5. 셀 병합 없이
❓피봇 테이블로 합산을 가능하게 하기 위해서! & 누가봐도 데이터를 이해 할 수 있게!
데이터를 확보 후 정리를 해야함
정리가 필요한 이유?
중복된 데이터, 형식이 다른것들을 모아주기 위함이다.
📍실습 데이터 클렌징
1. 전화 번호 형태 통일
서식 -> 숫자 -> 맞춤 숫자 형식 -> 0##-####-#### 지정하기
만약 맞춤 숫자 형식에 지정할 샘플에 없다면
직접 작성한 후 적용을 누르면 맞춤 숫자 형식이 생성된다.
2.chat GPT 한테 부탁하는방법
- chat GPT에 연결을 먼저해야한다.
OpenAI Platform
Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.
platform.openai.com
- 로그인을 한뒤 API 키를 만든다.
- 구글 스프레드 시트에 와서 확장프로그램을 설치해준다.
- 확장 프로그램은 GPT for google sheets and Docs
설치하면 스프레드 시트 오른쪽에 창이 하나 뜬다.
GPT 에서 가져온 API키를 입력하면 연동이 된다.
📍팀과제 - 데이터 리터러시
1️⃣ 다른 sheet의 데이터를 합쳐서 상관분석해서 가설을 세워보자
📍데이터 합치는 방법
- 엑셀 함수인 Vlookup을 통해 데이터를 묶어보자. (새시트에 꼭 따로 적기)
- 게시글 ID를 기본 KEY 삼아 게시글 링크와 게시일을 가져왔다.
❌ 날짜 데이터가 다른형태로 되어있기 때문에 주의해서 날짜 데이터 변환해야함! ❌
📍데이터 분석
데이터 테이블을 다 만들었다면 피봇테이블을 활용해서 각각 분석을 해보자
가설 1. 좋아요 수가 많으면 댓글 수가 많을 것이다.
✔️특정 날짜 (8/20일)에 만 유독 높은 숫자를 보이니 게시물 수가 많지 않을까?
확인 1.
✔️ 실제 좋아요와 댓글은 상관관계가 조금 있음 (1, -1 에 가까워야함)
✔️ 대신 좋아요와 공유의 상관관계를 발견!
가설 2. 직장을 가는 평일에 가장 많은 좋아요와 댓글이 달릴것이다.
확인 2.
✔️ 평일인 목요일이 많았지만 유독 너무 튀는것은 다른 의미가 있을 것같다.
❓요일별 포스팅 갯수를 봐볼까?
✔️ 실제 8월 20일이 가장 많은 게시물이 있고, 그날이 목요일이다.!
✔️ 포스팅이 많았으니 좋아요, 공유수, 댓글이 많았을 것이다. 확인!
가설 3. 도달은 공유와 좋아요, 댓글과 관련이 있을 것이다.
엑셀로 데이터 분석을 진행하며 데이터 전처리에 많은 시간이 들었다.
날짜가 뒤죽박죽이라 같은 데이터로 모으느라 작업에 시간이 오래걸렸다.
데이터를 볼 시간이 더 많았다면 다양한 가설이 나왔을 것이라 생각된다.
실제데이터로 데이터 분석을 진행하니 시간가는줄 몰랐다!
정리한거 토대로 한번 더 해봐야겠다.!
#청년취업사관학교 #데이터분석가 #데이터분석가부트캠프 #DA교육 #데이터분석교육 #실무프로젝트 #실무경험 #취업포트폴리오 #포트폴리오 #취업연계교육 #코멘토 #모비니티
'성동 1기_ 모빌리티 전Z전능 DA' 카테고리의 다른 글
Day 15 - GA4, GTM 태그 만들기 기초부터 중급까지 (1) | 2023.11.03 |
---|---|
Day 14 - GA4 데이터 수집 초기 환경 구성 & 데이터 분석 (1) | 2023.11.02 |
Day 12 - 데이터 분석 (엑셀2 /가설수립 ) (2) | 2023.10.31 |
Day 11- 데이터 분석 (엑셀/ 기초 함수) (2) | 2023.10.30 |
Day 10 - 디자인스프린트 마지막 (발표) (0) | 2023.10.27 |