카테고리 99

[23.06.12] Python Series, DataFrame 문제 - 07(5)

In [1]: import pandas as pd 1. friend_list.csv 파일을 불러와서 상위5개만 출력해 보세요.¶ In [2]: df = pd.read_csv('../data/friend_list.csv') df.head() Out[2]: name age job 0 John 20 student 1 Jenny 30 developer 2 Nate 30 teacher 3 Julia 40 dentist 4 Brian 45 manager 2. friend_list.txt 파일을 불러와서 상위 5개만 출력해 보세요.¶ In [3]: df_txt = pd.read_csv('../data/friend_list.txt') df_txt.head() Out[3]: name age job 0 John 20 st..

데이터분석 2023.06.12

[23.06.12] Python Series, DataFrame - 07(4)

시리즈와 데이터프레임 직접 만들기¶ 데이터 프레임과 시리즈는 리스트나 딕셔너리와 비슷하지만 데이터를 다루는 데 특화되어 있음¶ 1. 시리즈 만들기¶ In [1]: import pandas as pd In [3]: s = pd.Series(['apple', 33]) # 인덱스는 보통 0부터 시작 print(s) 0 apple 1 33 dtype: object In [5]: list_data = ['2023-04-28', 3.14, 'encore', 100, True] s = pd.Series(list_data) print(s) print('\n') print(type(s)) 0 2023-04-28 1 3.14 2 encore 3 100 4 True dtype: object In [7]: # 인덱스 배열은 ..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(3)

예제) CCTV.csv 첨부한 파일을 불러오세요.(CCTV.csv) 상위 5개의 데이터만 불러오세요. 상위 3개의 데이터만 불러오세요. 칼럼명만 출력하세요 In [3]: import pandas as pd In [4]: df = pd.read_csv('../data/CCTV.csv', sep='\t') In [5]: df.head() Out[5]: 구별,소계,최근증가율,인구수,한국인,외국인,고령자,외국인비율,고령자비율,CCTV비율,오차 0 강남구,2780,150.61919504643964,570500.0,565550.0,... 1 강동구,773,166.49076517150397,453233.0,449019.0,4... 2 강북구,748,125.20325203252031,330192.0,326686.0,3..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(2)

2023.06.12 - [데이터분석] - [23.06.12] Python pandas - 07(1) 의 코드 갭마인더 데이터 집합 불러오기¶ 판다스는 데이터프레임과 시리즈라는 자료형과 데이터 분석을 위한 다양한 기능을 제공하는 파이썬 라이브러리 1) 데이터 프레임(df)¶ 가로축과 세로축이 있는 엑셀과 유사한 데이터 구조 가로축: 로우(행) / 새로축 : 컬럼(열) 데이터프레임은 시리즈의 결합체 2) 시리즈¶ 데이터 프레임의 컬럼은 모두 시리즈 시리즈는 데이터 가공 및 분석이 파이썬 리스트 보다 훨씬 쉬움 In [1]: import pandas as pd In [2]: df = pd.read_csv('../data/gapminder.tsv', sep='\t') df Out[2]: country conti..

데이터분석 2023.06.12

[23.06.12] Python pandas - 07(1)

오늘부터 선생님이 바뀌었고 데이터 시각화를 위해 주피터로 바꾸게 되었다. 코드는 07(2) 1. Pandas (with Jupyter Notebook) * 판다스는 데이터프레임과 시리즈라는 자료형과 데이터 분석을 위한 다양한 기능을 제공하는 파이썬 라이브러리 * 엑셀과 상당히 유사함, 하지만 엑셀은 프로그램을 만들 수 없음 * 데이터의 수정 및 가공이 용이 * 파이썬으로 프로그램을 만들 때 데이터를 변경하고 싶을 때 엑셀을 사용 못 함 * 데이터 가공을 위한 수많은 처리가 상당히 빠름 * Numpy 기반으로 데이터 처리가 상당히 빠름 * 수학적으로 변경, 계산할 때 판다스가 엑셀보다 빠름 1) 데이터 프레임(df) * 데이터프레임은 2차원 배열 * 여러 개의 시리즈들이 모여서 데이터프레임을 이루는 구조 ..

데이터분석 2023.06.12

[Weekly 회고] - 02

23.06.05 ~ 23.06.11, 2주차 https://playdata.io 1️⃣ 느낀점 파이썬의 후반부(제어문, 함수, 클래스)를 배우는 시간이었다. 클래스는 가장 약한 부분이라 수업을 열심히 들었었다. 선생님께서 함수와 클래스, 이전에 배웠던 메서드들을 활용한 문제를 내주셔서 이해에 도움이 될 수 있었다. 나름 깔끔하게 코드를 짰다고 생각했지만, 선생님이 짜신 코드를 보면서 아직 나는 햇병아리라는 것을 느꼈다🤣 2주차는 다시 한 번 겸손을 느끼는 주였다. 2️⃣ 좋았던 점 힘든 퇴근길을 이겨내고 집에서 한 시간이라도 복습과 다른 공부를 했다. 취업을 위해 알고리즘 공부를 다시 시작했는데 그 날 문제를 다 못풀더라도 다음 날에 이어서 풀었다. 이번 주를 기반으로 습관을 길러서 시간을 잘 활용할 수..

끄적끄적 2023.06.11

[23.06.09] Python 객체 지향, 모듈 (야구 게임 만들기) - 06(2)

1 ~ 9 사이의 중복되지 않는 3개의 숫자 - ex) [3, 4, 7] 1 ~ 9 사이의 중복되지 않는 3개의 숫자 입력 - ex) [1, 4, 9] Strike, Ball, Out 두 개의 리스트가 위치와 값이 같으면 strike - ex) [1, 2, 5], [1, 2, 5] 위치가 다르지만 값이 존재하면 ball - ex) [1, 2, 5], [3, 2, 5] or [1, 8, 5] 위치, 값 모두 다르면 out - ex) [1, 2, 5], [6, 3, 9] 3개의 strike가 나오거나 7번 진행 시, 정답을 출력하고 종료 ## 아직 덜 짰33 정답 출력: 누적해서 전체 몇 번 게임 했는지, 몇 번 이겼는지 통계로 출력 import random class BaseBallData: def __i..

데이터분석 2023.06.09

[23.06.09] Python 객체 지향, 모듈 - 06(1)

1. 객체 지향 - 추상화: 어떤 물체의 특징을 파악하고 고유의 특징을 뽑아내는 것 -> 사람이 사물을 바라보는 형태로 프로그램을 함 - 변수와 함수는 별개, 따로따로 만듦 - 변수도 많고 함수도 많아 관리가 어려움 -> 이 중에 어떤 변수와 함수는 서로 관련이 있음 -> 관련있는 변수와 함수를 묶어보자 => 클래스(사용자가 만드는 데이터 타입) -> list, dict, tuple : 시스템이 만드는 클래스, 내장 라이브러리, 내장 클래스 -> 위의 클래스들을 부품형 클래스 - 부품형 클래스 만드는 방법 -> 부품을 사용하여 완성형 클래스를 만드는 방법은 서로 다름 - 최종 목적: 프로그램을 빠르고 확장성 있도록 만들기 위함 -> 관련있는 것들끼리 묶어서 클래스를 만들기 (list, dict 등) ->..

데이터분석 2023.06.09

[23.06.08] Python comprehension, random - 05(2)

1. comprehension (컴프리헨션) - list 타입에만 축약 - list 타입에서 데이터 추출하기 위한 용도[변수명 for 변수명 리스트타입] [변수명 for 변수명 리스트타입 if 조건식] # 조건식이 True인 것만 추출 [함수(변수명) for 변수명 리스트타입 if 조건식] # 조건식이 True인 것중에 값 변경해서 추출 1) soft copy(shallow copy)와 hard copy(deep copy) - 파이썬의 모든 변수는 데이터 자체가 아니라 데이터의 주소를 저장 - EX) 만약 nums 라는 변수가 있을 때, nums2 = nums 라고 하면, 이 때 nums2에는 nums에 저장된 주소값이 복사되어 실제 데이터는 하나이고 두 개의 변수가 같은 데이터를 소유하게 됨 => so..

데이터분석 2023.06.08
반응형