파이썬이란?
파이썬과 데이터 분석
오늘은 파이썬 기초를 배워보도록 하겠습니다.
📌아나콘다 설치하기
우선 파이썬을 쓰기위해 아나콘다를 설치해주세요!
Free Download | Anaconda
Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.
www.anaconda.com
사양에 맞게 설치해주시고 실행시키면 이런창이 뜹니다.
요기에서 오늘 사용할 주피터 노트북을 실행시켜주세요 ~
주피터 노트북을 실행하면 이렇게 노트북이 실행되는데 여기서 폴더를 하나 만들어서 노트탭을 열어줍니다.
오른쪽 상단에"New"를 누르면 노트북이 열립니다!
쨔잔!! 오늘부터 사용할 노트북입니다~!!!
-설치완료-
📌파이썬 기초
📍자료형
1. 변수 : 다양한 자료형의 값을 저장하는 공간
내가 원하는 값을 넣어 지정하는것 , 주의❗️ 변수를 지정할때는 꼭 " = " 부등호 기호를 써줘야합니다.
변수이름 = 변수에 저장할 값
a = 1 #a에 1을 할당
a #a 출력
#실습 a,b,c 라는 변수를 만들어 각각 다른 값을 지정한 후 출력하여 값 확인하기
a = 1
b = 2
c = 3
print(a,b,c)
#값 1 2 3
2. 숫자 : 숫자 형태로 이루어진 자료형
항목 | 파이썬 사용 |
정수 | 123. -345, 0 |
실수 | 123.45 -1234.5 |
8진수 | 0o34, 0o25 |
16진수 | 0x2A, 0xFF |
항목 | 연산자 |
사칙연산 | +,-,*,/ |
제곱연산 | ** |
나머지 연산 | % |
몫 연산 | // |
#실습 홍길동씨의 국어점수 80, 영어점수 75, 수학 점수 55일때 홍길동 씨의 평균 점수를 구해 보자
국어 = 80
영어 = 75
수학 = 55
print((국어+영어+수학)/ 3)
# 자연수 13이 홀수인지, 짝수인지 판별할 수 있는 방법은?
# 쉬운 ver
13 % 2
⬆️ 위 코드를 실행하려면 재생버튼 ▶️ 눌러주세요!
3. 문자 : 문자열(string), 문자들의 집합
"따옴표로 둘러싸여 있으면 모두 문자열이다"
#1. 큰 따옴표(")로 감싸기
"Hello world"
#2. 작은 따옴표(')로 감싸기
'"Pyhton is very easy."he says.'
#3. 연속된 따옴표 3개 사용하기
Multiline = '''Life is too short you neet python'''
#4. 문자열 덧셈
head ="Python"
tail = "is fun!"
head + tail
# -> Python is fun!
#5. 문자열 곱셈
a = "Python"
a * 2
# -> 'PythonPython'
#6. 문자열 길이 구하기
a = " "
len(a)
# -> 1
a = "Life is too short"
len(a)
# -> 17
## len() -> 괄호 안 문자열의 길이를 출력하는 함수
3.1 문자열 슬라이싱
문자열의 필요한 부분만 추출해오는 것
* 인덱싱은 0 부터 시작!!!
a[0:4] # 0 <= a < 3
3.2 * 슬라이싱 기법
a[x:y] -> a[x]부터 a[y-1]까지
a[5:] -> 5번째부터 끝까지
a[:17] -> 처음부터 17번까지
a[19:-7] -> 19번째부터 뒤에서 7번까지 가져와라
3.3문자열 포매팅
" 문자열 안에 변수를 삽입하는것"
코드 | 설명 |
%s | 문자열 |
%c | 문자 1개(character) |
%d | 정수(interger) |
%f | 부동소수 |
%o | 8진수 |
%x | 16진수 |
%% | '%' 문자자체 |
"I eat %d apples" %3 # 정수 대입
#-> 'I eat 3 apples.'
"I eat %s apples." % "five" # 문자열 대입
#-> I eat five apples.
number=3
"I eat %d apples." % number # 변수 대입
#-> I eat 3 apples.
number = 10
day = "three"
"I ate 10 apples.so I was sick for %s days." % (number, day)
#-> 'I ate 10 apples. so I was sick for three days.'
* 두개 이상의 값을 넣으려면 괄호 안에 콤마(,)로 구분하여 각각 넣어주면 된다.
3.4 format 함수를 사용한 포매팅
문자열의 끝에 .format() 함수를 사용하면 좀 더 발전된 스타일로 문자열 포맷 지정 가능
# 인덱스 사용
number=10
day ="three"
"I ate {0} apples. so I was sick for {i}.format(number,day)
#->'I ate 10 apples. so I was sick for three days'
#변수 사용
"I ate {number} apples. so I was for {day}days".format(number=10,day='three')
#->'I ate 10 apples. so I was for threedays'
#인덱스 와 변수 동시 사용
"I ate {0} apples. so I was sick for {day} days".format(10,day=3)
#->'I ate 10 apples. so I was sick for 3 days'
3.5 문자열 내장 함수
문자열 자료형은 자체적으로 아래와 같이 다양한 함수를 가지고 있다.
함수명 | 설명 |
a.count(b) | a문자열 중 문자 b의 개수 변환 |
a.find(b) | a 문자열 중 문자 b가 처음으로 나온 위치 반환 |
a.join(b) | b문자열[리스트도가능]의 사이에 a를 삽입 |
a.upper() | a문자열을 대문자로 변환 |
a.lower() | a문자열을 소문자로 변환 |
a.strip() | a문자열의 양 옆 공백 모두 제거 |
a.replace(b,c) | a문자열의 b문자를 c문자로 대체 |
a.split(b) | b문자를 기준으로 a 문자열 분할 |
* 찾는 문자나 문자열이 존재하지 않는다면 -1 반환
# 홍길동씨의 주민번호 881120-1068234 을 연월일(YYYYMMDD)와 뒤의 숫자 부분으로 나누어 출력해보자
a= "881120-"
b = "1068234"
bn = a.replace('88','1988') #바뀐 변수 꼭 넣기
bn+b
#-> '19881120-1068234'
#홍길동씨의 주민번호 881120-1079234 에서 성별을 나타내는 숫자를 출력해보자
홍길동 = "881120-1079234"
홍길동[7]
# -> '1'
#join 함수 !!
# join 함수
a = ["Joy","IS","TOO","Beautiful"]
" ".join(a)
#-> 'Joy IS TOO Beautiful'
# 문자열 "a:b:c:d"를 "a#b#c#d"로 바꿔서 출력해보자 a ="a:b:c:d" bn = a.replace(":","#") #바뀐 변수 꼭 넣기! bn #-> 'a#b#c#d'
4. 리스트 - 여러 요소의 모음
리스트명 = [요소1,요소2,요소3 ﹒﹒﹒]
대괄호([])로 감싸주고 각 요솟값은 쉼표(,)로 구분한다.
파이썬의 리스트 안에는 어떠한 자료형도 포함시킬 수 있다.
a = []
b =[1,2,3]
c =['Life','is','too','short']
d =[1,2,'life','is']
e =[1,2,['life','is']] #리스트 중첩 가능
4.1 리스트 인덱싱과 슬라이싱
리스트도 문자열과 동일한 인덱싱을 사용한다
#리스트 인덱싱
a =[1,2,3,4]
a[0]
#-> 1
a[0] + a[2] # 1+3
# -> 4
a[-1] # 마지막 요소
#-> 4
이중리스트 인덱싱
a=[1,2,3,['a','b','c']]
a[3]
#-> ['a','b','c']
a[3][0] #3번째 요소의 0번째 요소
#-> 'a'
a[3][1]
#->'b'
a[-1][2]
#->'c'
4.2 리스트 내장 함수
함수 | |
append(x) | 리스트의 맨 마지막에 x 추가 |
sort() | 리스트의 요소를 순서대로 정렬 |
reverse() | 리스트를 역순으로 변환 |
index(x) | 리스트에 x값이 있으면 x의 인덱스 값을 리턴 |
insert(a,b) | 리스트의 a 번째 위치에 b를 삽입 |
remove(x) | 리스트에서 첫 번째로 나오는 x를 삭제 |
pop() | 리스트의 맨 마지막 요소를 리턴(반환), 해당 요소 삭제 |
count(x) | 리스트 안에 x 요소의 개수를 리턴 |
extend(x) | 리스트에 x 리스트 더하기 |
#리스트 정렬 default는 내림차순
a=[1,4,3,2]
a.sort()
a
#-> [1,2,3,4]
#리스트 정렬 오름차순
a=[1,4,3,2]
a.sort(reverse=True)
a
#->[4,3,2,1]
5. 튜플( 리스트와 비슷하지만 튜플의 값은 바꿀 수 없다!)
# 튜플
t1 =()
t2 =(1,) ## 주의 튜플은 요소가 하나여도 쉼표를 넣어줘야함
t3 = (1,2,3)
t4 = 1,2,3
t5 = ('a','b',('ab','cd'))
#단지 1개의 요소만을 가질 때는 요소 뒤에 쉼표(,)를 반드시 붙여야 한다.
# 소괄호(())를 생략해도 튜플 생성이 가능하다.
6. 딕셔너리
{key1:value1, key2:value2, ﹒﹒﹒}
key와 Value를 한 쌍으로 가지는 자료형
Key:Value 형태로 이루어진 각각의 요소가 중괄호({})로 둘러쌓인 형태
#딕셔너리
dic={'name':'pey','phone':'010-1111-1111','birth':'1118'}
dic
#->[[{'name': 'pey', 'phone': '010-1111-1111', 'birth': '1118'}]]
6.1 딕셔너리 매장함수
함수명 | 설명 |
keys() | 딕셔너리의 key 값을 dict_keys 객체로 리턴 |
values() | 딕셔너리의 Value값을 dict_keys 객체로 리턴 |
items() | Key와 Value의 쌍을 튜플로 묵은 값을 dict_items객체로 리턴 |
clear() | 딕셔너리 안의 모든 요소를 삭제 |
get(x) | x라는 Key에 대응되는 x를 삭제 |
in(x) | x가 딕셔너리 안에 있는지 여부 리턴 |
오늘 파이썬을 다시 사용해보니 까먹었던 부분이 많았고
내장 함수들중 몰랐던 부분이 생각보다 많았다.
담주에 벌써 조건문 배운다고 했는데 함수들 잘 사용해야 조건문을 사용할 수 있을것같아 연습이 많이 필요할것같다.
다음달 AICE 시험도 또 봐야겠당...!!!!!
#청년취업사관학교 #데이터분석가 #데이터분석가부트캠프 #DA교육 #데이터분석교육 #실무프로젝트 #실무경험 #취업포트폴리오 #포트폴리오 #취업연계교육 #코멘토 #모비니티
'성동 1기_ 모빌리티 전Z전능 DA' 카테고리의 다른 글
Python 기초 (3) - 함수, 데이터프레임,어트리뷰트, 매서드, 데이터 분석 기초 (0) | 2023.11.29 |
---|---|
SQL 팀 프로젝트(3) - EDA 분석, 가설 세우기, 가설 검증 (2) | 2023.11.28 |
SQL 팀프로젝트 (2) - EDA 분석, NULL 값 치환, 가설 세우기 (1) | 2023.11.22 |
SQL 팀프로젝트 (1) - 공공데이터를 활용한 데이터 정합성 분석(NULL 값, 중복 값, count) (1) | 2023.11.20 |
SQL 다시보기2. JOIN/GROUP BY/ DISTINCT/ HAVING활용하기 (0) | 2023.11.16 |