오늘은 함수를 배워보도록 하겠습니다.
두둥!
📌함수(function)
값을 넣으면 특정한 기능을 수행해 처음과 다른 값으로 만듦
def add(a,d) :
return a + b
* 이 함수의 이름은 add이고 입력으로 2개의 값을 받으며 리턴값(출력값)은 2개의 함수를 돌려준다.
📍패키지
함수가 여러개 들어 있는 꾸러미로 함수를 사용하려면 패키지 설치를 먼저해야함
# 패키지 로드하기
import seaborn as sns #sns가 대부분 쓰는 약어임
📍모듈
패키지 seaborn 안에 있는 것으로 함수를 묶어 모듈이라고 표시한다.
# 패키지명,모듈명.함수명() 으로 함수 사용하기
import sklearn.metrics
sklearn.metrics.accuracy_score
# 모듈명,함수명() 으로 함수 사용하기
import sklearn import metrics
metrics.accuracy_score()
# 함수명()으로 함수 사용하기
from sklearn.metrics import accuracy_score
accuracy_score()
모듈들도 다 약어가 사용가능하다.
import sklearn.metrics as met
met.accuracy_score()
from sklearn.metrics import accuracy_score as accuracy
accuracy()
📍패키지 설치하기(맥 기준)
맥은 따로 아나콘다 프롬프트가 없기때문에 일반 terminal 을 열어주고
바로 'pip install pydataset' 만 작성하면 바로 설치를 한다.
pip install pydataset
📍pydataset 사용해보기
import pydataset
pydataset.data()
작성하면 데이타의 테이블을 볼 수 있다.
📌데이터 프레임(DATAFRAME)
엑셀에서 보는 데이터 표가 파이썬에서 데이터 프레임이다.
데이터를 다룰 때 가장 많이 사용하는 데이터 형태로 행(row)과 열(Column)로 구성됨.
열 - 속성으로 컬럼 또는 변수 라고 불림
행 - 한 사람의 정보이며 로우 또는 케이스 라고 불린다.
✔️ 데이터가 크다 ?
행이 많다 또는 열이 많다! 데이터가 많은게 좋은 거라면?
기본적으로 행이 많아야 좋은것도 있지만 심도있는 분석이 필요하다면 열이 많은것이 중요하다!
왜냐면 열은 변수가 많아지는 것이니 더 세세한 정보를 알 수 있음
📍데이터 프레임 만들기
* 데이터를 입력해 데이터 프레임 만들기 (결과값을 함께 보기 위해 이미지로 대체)
📍특정 변수 값 추출하기
방금 만든 데이터 프레임에서 특정 변수를 추출해보자
📍변수의 값으로 합계 및 평균 구하기
실습
📌외부 데이터 불러오기
외부데이터는 pd.read_csv(xlsx,excel)등 가져올 수 있음
❓ 만약 파일의 헤더가 없다면?
파일을 불러올때 header = None 값을 주면 행이 없어도 불러올 수 있음
❓엑셀파일에 시트가 여러개 있다면?
파일을 불러올때 sheet_name = 'Sheet이름' or 몇번째 시트인지 숫자를 주기
📌데이터 분석 기초
📍매서드(method)
변수가 지니고 있는 함수 = 기술
예를 들어 df.head() 나 df.info() 같은 함수들을 매서드라고 한다.
# 데이터 파악하기
head() # 앞부분 출력
tail() # 뒷부분 출력
shape # 행, 열 개수 출력
info() # 변수 속성 출력
describe() # 요약 통계량 출력
mpg.describe(include='all') # 문자 변수 요약 통게량 함께 출력
descirbe 의 속성
📍어트리뷰트 (attribute)
변수가 지니고 있는 값 = 능력치
변수의 자료 구조에 따라 달라짐
df.shape
# (20,5)
📍변수명 바꾸기
df_new = df_new.rename(columns={'var2':'v2'}) # Var2 를 v2로 바꿈
df_new
✔️df.copy()를 사용하는 이유
어느 한쪽 수정하면 다른 한쪽도 수정됨
복사본을 수정해도 원본은 영향받지 않도록 df.copy() 를 사용한다!
거의 하루만에 파이썬의 기초와 데이터프레임까지 쭉 나갔는데
나는 이미 파이썬의 기초는 알고있었기에 다시 리마인드 하기에 너무 좋았다.
다만 아직도 알고리즘 푸는 문제는 어려워서.. 꼭 연습이 필요하겠다.
'성동 1기_ 모빌리티 전Z전능 DA' 카테고리의 다른 글
Python 그래프 만들기 - Matplotlib, seaborn (0) | 2023.12.01 |
---|---|
Python 기초 (6)- 결측치 처리,이상치처리,기준값 찾기, dropna, isna,IQR (0) | 2023.11.30 |
SQL 팀 프로젝트(3) - EDA 분석, 가설 세우기, 가설 검증 (2) | 2023.11.28 |
Python 기초(1) - 아나콘다 설치, 주피터 노트북 설치, 파이썬 기초, 내장함수 (0) | 2023.11.24 |
SQL 팀프로젝트 (2) - EDA 분석, NULL 값 치환, 가설 세우기 (1) | 2023.11.22 |