데이터 다루기 유형
1. 데이터 타입
2. 기초통계량
3. 인덱싱
4. 결측치, 이상치, 중복값 처리
5. 데이터 스케일링
6. 데이터 병합
7. 날짜/시간 데이터 처리, 인덱스 처리
import pandas as pd
import numpy as np
df = pd.read_csv("data/mtcars.csv")
# 사용자 코딩
df.head()
print(df.head())
Q1 = df['mpg'].quantile(0.25)
Q2 = df['mpg'].quantile(0.5)
Q3 = df['mpg'].quantile(0.75)
Q4 = df['mpg'].quantile(1)
print(round(Q1))
print(Q1)
print(round(Q1,2))
print(round(Q2))
print(Q3)
print(round(Q4,2))
cond1 = (df['mpg']>=19)
cond2 = (df['mpg']<=21)
print(df[cond1 & cond2])
print(len(df[cond1 & cond2]))
Q1 = df['hp'].quantile(0.25)
Q3 = df['hp'].quantile(0.75)
IQR = Q3 - Q1
print(IQR)
top10 = df.sort_values('wt', ascending=False)
print(top10['wt'].head(10))
sum_top10 = sum(top10['wt'].head(10))
print(int(sum_top10))
len_6 = len(df[df['cyl']==6])
len_total = len(df)
print(len_6)
print(len_total)
print(round(len_6/len_total,3))
df10 = df[:10]
df.loc[0:9]
df.head(10)
print(df10)
print(df.loc[0:9])
print(df.head(10))
mean10 = df10['mpg'].mean()
print(round(mean10))
빅분기 실기체험 (구름 플랫폼) 기반 실습 중.. 0.5%
'도전기 > 빅분기' 카테고리의 다른 글
003_제3유형_구름 기반 실습 (0) | 2024.11.12 |
---|---|
002_제2유형_구름 기반 실습 (0) | 2024.11.11 |
002_빅데이터분석기사 실기_단기간_합격_준비 (1) | 2024.10.02 |
000_빅데이터 분석기사_필기_합격수기_ADP비교 (0) | 2024.09.22 |
혼공_DAY_04_빅데이터 결과 해석 (0) | 2024.09.04 |