⚙️ Data Handling
📌 Pivot Table
import pandas as pd
pd.pivot_table(data, index=[기준 인덱스 리스트], values=[필요한 데이터 리스트],
columns=[항목별로 볼 데이터], aggfunc=[값에 취할 함수], fill_value = 결측치 대체값)
#ex)
pd.pivot_table(data, index=["Manager","Rep"], values=["Price"],
columns=["Product"], aggfunc=[np.sum], fill_value = 0)
#ex
pd.pivot_table(data, index=["Manager","Rep"], values=["Price", "Quantity"],
columns=["Product"], aggfunc={
"Price": [np.mean, np.sum],
"Quantity": np.sum
}, fill_value = 0)
📌 빈도 테이블
pd.crosstab(data["Name"], data["Rep"])
📌 Group By
data.groupby(by="기준").집계함수
- agg : 각기 다른 요소에 다른 상황을 적용
data.groupby(by=["month","item"]).agg(
{
"date":"first",
"duration":"count"
}
)