📌 EDA
- EDA의 개념
- 탐색적 데이터 분석. Domain knowledge 성장에 도움을 주며,
python dataframe에 사용하는 head() 함수가 해당한다.
- 탐색적 데이터 분석. Domain knowledge 성장에 도움을 주며,
- EDA의 종류
숫자 | 시각화 | |
변수 1개 | 평균, 중앙값, 분산, 표준편차... | 히스토그램, 박스플롯... |
변수 N개 | 공분산, 상관관계... | 산점도, 히트맵 |
📌 Machine Learning & Deep Learning
- ML & DL의 차이점
- ML : 주로 정형 데이터를 이용하며, 알고리즘을 가진다.
- DL : 주로 비정형 데이터를 이용하며, 알고리즘 보단 주로 레이어를 가진다.
📌 Excel Works
- 엑셀 기초 및 고급 함수
- AVERAGE, MEDIAN, VAR.S, STDEV.P, MIN, MAX, QUARTILE.INC, SKEW, KURT
- 상대참조, 절대참조, VLOOKUP, HLOOKUP, IF, ISERROR, IFERROR, SUMPRODUCT
- VLOOKUP : 열을 기준으로 값을 검색
- HLOOKUP : 행을 기준으로 값을 검색
- VLOOKUP함수에서 여러 가지 조건을 사용하기 위해서는 SUMPRODUCT를 사용하며,
다른 방법으로는 조건 열들을 &로 붙이고 VLOOKUP을 사용하는 방법이 있다.
- EDA
- IQR : 대표적인 전처리대상. Q3-Q1
- 왜도 : 그래프가 한 쪽으로 쏠린 정도
- 첨도 : 그래프의 뾰족한 정도
- 결정계수 실습
- 결정계수(R^2) = 1 - (SSE/SST)
- 의사결정나무
- 지니계수 = 1 - (ClassA/전체)^2 - (ClassB/전체)^2
- 퍼셉트론 실습
- epoch 진행에 따라 정답률이 계속해서 변화한다.
- CNN
- Input 데이터에 kernel(filter)을 적용하여 특징이 추출된 feature map을 획득하는 것을 반복한다.