데이터분석 57

[23.06.13] Python 클래스 - 08(2)

1. 자동차 상태 알아보기# 예제 1) 자동차 색상과 속도 class Car: color = "" speed = 0 def __init__(self, value1, value2): self.color = value1 self.speed = value2 def upSpeed(self, value): # self, speed 는 3행의 speed 의미 self.speed += value # 즉, 자신의 클래스에 있는 speed 변수 if self.speed >= 150: self.speed = 150 def downSpeed(self, value): self.speed -= value # main code part myCar1 = Car("빨강", 30) myCar2 = Car("파랑", 60) # oupu..

데이터분석 2023.06.13

[23.06.13] Python 클래스 - 08(1)

1. 클래스result1 = 0 result2 = 0 def add1(num): global result1 result1 += num return result1 def add2(num): global result2 result2 += num return result2 print(add1(3)) print(add2(3)) * 위의 코드는 계산기 프로그램 * 함수로 두 개의 계산기를 만들었는데, 10개의 계산기를 만들기 위해 함수 10개가 필요함?? * 이를 해결하기 위한 것이 "클래스" * 클래스 안에서 구현된 함수는 함수라고 하지 않고 메서드라고 함 1) 클래스는 왜 필요한가? - 반복되는 변수나 메서드(함수)를 미리 정해놓은 틀(설계도)############ 위의 함수를 클래스로 묶어 계산기 만듦 ##..

데이터분석 2023.06.13

[23.06.12] Python Series, DataFrame 문제 - 07(5)

In [1]: import pandas as pd 1. friend_list.csv 파일을 불러와서 상위5개만 출력해 보세요.¶ In [2]: df = pd.read_csv('../data/friend_list.csv') df.head() Out[2]: name age job 0 John 20 student 1 Jenny 30 developer 2 Nate 30 teacher 3 Julia 40 dentist 4 Brian 45 manager 2. friend_list.txt 파일을 불러와서 상위 5개만 출력해 보세요.¶ In [3]: df_txt = pd.read_csv('../data/friend_list.txt') df_txt.head() Out[3]: name age job 0 John 20 st..

데이터분석 2023.06.12

[23.06.12] Python Series, DataFrame - 07(4)

시리즈와 데이터프레임 직접 만들기¶ 데이터 프레임과 시리즈는 리스트나 딕셔너리와 비슷하지만 데이터를 다루는 데 특화되어 있음¶ 1. 시리즈 만들기¶ In [1]: import pandas as pd In [3]: s = pd.Series(['apple', 33]) # 인덱스는 보통 0부터 시작 print(s) 0 apple 1 33 dtype: object In [5]: list_data = ['2023-04-28', 3.14, 'encore', 100, True] s = pd.Series(list_data) print(s) print('\n') print(type(s)) 0 2023-04-28 1 3.14 2 encore 3 100 4 True dtype: object In [7]: # 인덱스 배열은 ..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(3)

예제) CCTV.csv 첨부한 파일을 불러오세요.(CCTV.csv) 상위 5개의 데이터만 불러오세요. 상위 3개의 데이터만 불러오세요. 칼럼명만 출력하세요 In [3]: import pandas as pd In [4]: df = pd.read_csv('../data/CCTV.csv', sep='\t') In [5]: df.head() Out[5]: 구별,소계,최근증가율,인구수,한국인,외국인,고령자,외국인비율,고령자비율,CCTV비율,오차 0 강남구,2780,150.61919504643964,570500.0,565550.0,... 1 강동구,773,166.49076517150397,453233.0,449019.0,4... 2 강북구,748,125.20325203252031,330192.0,326686.0,3..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(2)

2023.06.12 - [데이터분석] - [23.06.12] Python pandas - 07(1) 의 코드 갭마인더 데이터 집합 불러오기¶ 판다스는 데이터프레임과 시리즈라는 자료형과 데이터 분석을 위한 다양한 기능을 제공하는 파이썬 라이브러리 1) 데이터 프레임(df)¶ 가로축과 세로축이 있는 엑셀과 유사한 데이터 구조 가로축: 로우(행) / 새로축 : 컬럼(열) 데이터프레임은 시리즈의 결합체 2) 시리즈¶ 데이터 프레임의 컬럼은 모두 시리즈 시리즈는 데이터 가공 및 분석이 파이썬 리스트 보다 훨씬 쉬움 In [1]: import pandas as pd In [2]: df = pd.read_csv('../data/gapminder.tsv', sep='\t') df Out[2]: country conti..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(1)

오늘부터 선생님이 바뀌었고 데이터 시각화를 위해 주피터로 바꾸게 되었다. 코드는 07(2) 1. Pandas (with Jupyter Notebook) * 판다스는 데이터프레임과 시리즈라는 자료형과 데이터 분석을 위한 다양한 기능을 제공하는 파이썬 라이브러리 * 엑셀과 상당히 유사함, 하지만 엑셀은 프로그램을 만들 수 없음 * 데이터의 수정 및 가공이 용이 * 파이썬으로 프로그램을 만들 때 데이터를 변경하고 싶을 때 엑셀을 사용 못 함 * 데이터 가공을 위한 수많은 처리가 상당히 빠름 * Numpy 기반으로 데이터 처리가 상당히 빠름 * 수학적으로 변경, 계산할 때 판다스가 엑셀보다 빠름 1) 데이터 프레임(df) * 데이터프레임은 2차원 배열 * 여러 개의 시리즈들이 모여서 데이터프레임을 이루는 구조 ..

데이터분석 2023.06.12

[23.06.09] Python 객체 지향, 모듈 (야구 게임 만들기) - 06(2)

1 ~ 9 사이의 중복되지 않는 3개의 숫자 - ex) [3, 4, 7] 1 ~ 9 사이의 중복되지 않는 3개의 숫자 입력 - ex) [1, 4, 9] Strike, Ball, Out 두 개의 리스트가 위치와 값이 같으면 strike - ex) [1, 2, 5], [1, 2, 5] 위치가 다르지만 값이 존재하면 ball - ex) [1, 2, 5], [3, 2, 5] or [1, 8, 5] 위치, 값 모두 다르면 out - ex) [1, 2, 5], [6, 3, 9] 3개의 strike가 나오거나 7번 진행 시, 정답을 출력하고 종료 ## 아직 덜 짰33 정답 출력: 누적해서 전체 몇 번 게임 했는지, 몇 번 이겼는지 통계로 출력 import random class BaseBallData: def __i..

데이터분석 2023.06.09
반응형