전체 글 99

[23.06.20] SQL - 13(1)

나만 보는 SQL~ 오라클 1. DBMS(DatBase Management System) https://db-engines.com/en/ranking DB-Engines Ranking Popularity ranking of database management systems. db-engines.com 2. DBMS 역사 1) 1세대 - 화일 시스템 2) 2세대 - 계층형 3) 3세대 - 망형 4) 4세대 - 관계형 * 현재 가장 많이 사용되는 형태 5) 5세대 - 객체 지향형 3. 그리드 컴퓨팅 위치상으로 분리되어 있찌만 원기리 통신망을 이용하여 여러 대의 컴퓨터를 가상화시켜 하나의 대용량 시스템을 정리 4. 테이블 = 파이썬의 데이터 프레임 = 엑셀의 시트 5. Oracle SQL Developer 6..

데이터분석 2023.06.20

[23.06.19] Python time series - 12(3)

시계열(Time Series) 분석¶ 시계열 자료(time series) 년도별 계절별 월별 일별 시 분 초별로 시간의 흐름에 따라 관측된 자료 시계열자료의 분석 목적: 1) (forecast) 미래에 대한 예측 2) 시스템 또는 확률과정의 이해와 제어(control) datetime 오브젝트¶ 날짜와 시간을 처리하는 등의 다양한 기능을 제공하는 파이썬 라이브러리 날짜를 처리하는 date 오브젝트 시간을 처리하는 time 오브젝트 날짜와 시간을 처리하는 datetime 오브젝트가 포함되어 있다. datetime 오브젝트¶ In [1]: from datetime import datetime In [2]: now1 = datetime.now() now1 Out[2]: datetime.datetime(2023..

데이터분석 2023.06.19

[23.06.19] Python pandas titanic problem - 12(2)

titanic 데이터셋(sns.load_dataset('titanic')) 에서 ['age','sex', 'class', 'fare', 'survived'] 5개 열을 선택해서 df를 만드세요. class 열을 기준으로 분할하고 각 그룹에 대한 모든 열의 표준편차를 집계하여 df로 반환하세요. 최대값과 최소값의 차를 계산하는 사용자 정의 함수(minmax) 를 만들고 각 그룹의 최대값과 최소값의 차리를 계산하여 그룹별로 집계해 보세요. 각 열에 2개 함수(min, max)함수를 일괄 적용해 보세요. fare 열에는 min, max 함수를, age 열에는 mean 함수를 적용해 보세요. age 열의 평균이 30보다 작은 그룹만을 필터링하여 데이터프레임으로 반환하세요 In [1]: import pandas ..

데이터분석 2023.06.19

[23.06.19] Python groupby, aggregate, transform, filter - 12(1)

그룹 연산은 데이터를 집계하거나 변환하는 등의 작업을 한 번에 처리할 수 있는 기능¶ groupby 메서드로 평균값 구하기¶ In [1]: import warnings warnings.simplefilter(action="ignore", category = FutureWarning) import pandas as pd df = pd.read_csv('../../data/gapminder.tsv', sep='\t') df Out[1]: country continent year lifeExp pop gdpPercap 0 Afghanistan Asia 1952 28.801 8425333 779.445314 1 Afghanistan Asia 1957 30.332 9240934 820.853030 2 Afghan..

데이터분석 2023.06.19

[Weekly 회고] - 03

23.06.12 ~ 23.06.18, 3주차 1️⃣ 느낀점 3주차는 pandas 라이브러리를 이용하여 데이터를 수정하고 가공하였다. concat, merge, melt 등 다양한 메서드를 사용해서 데이터 분석을 했다. 논문 쓸 때 단순히 실험 결과 그래프를 뽑으려고 썼던 pandas였는데 더 깊게 배우는 시간이었다. 2️⃣ 좋았던 점 공공 데이터를 사용해서 데이터 분석을 복습하였다. 대학생 때 전공 과목에서 '서울시 구 별 어린이 보호구역'에 대한 데이터 분석을 했었는데, 이를 통해 복습을 하니 pandas의 메서드에 어느 정도 적응할 수 있었다. 추가적으로 1일 1 Git을 실천했고, 프로그래머스 알고리즘도 매일 풀었다. 3️⃣ 아쉬웠던 점 여기서 배웠던 새로운 메서드들이 있는데 아직 익숙하지가 않다...

끄적끄적 2023.06.18

[23.06.16] Python apply, 문제 - 11(4)

apply 메서드 활용¶ apply 메서드는 사용자가 작성한 함수를 한 번에 데이터 프레임의 각 행과 열에 적용하여 실행할 수 있게 해주는 메서드 데이터 프레임의 누락값을 처리한 다음 apply 메서드 사용하기¶ 1. 데이터 프레임의 누락값 처리하기 - 열방향¶ In [1]: import seaborn as sns titanic = sns.load_dataset("titanic") titanic.head() Out[1]: survived pclass sex age sibsp parch fare embarked class who adult_male deck embark_town alive alone 0 0 3 male 22.0 1 0 7.2500 S Third man True NaN Southampton ..

데이터분석 2023.06.16

[23.06.16] Python data_type - 11(3)

자료형을 자유자재로 변환하기 - astype 메서드¶ In [1]: import warnings warnings.simplefilter(action="ignore", category = FutureWarning) In [2]: import pandas as pd import seaborn as sns tips = sns.load_dataset('tips') tips Out[2]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.5..

카테고리 없음 2023.06.16
반응형