반응형 필기 요약1 혼공_DAY_02_빅데이터 탐색 확률분포의 정의기하포아송정규이항확률표본 평균값, 표본 분산/N, /N-1최대 최소 정규화데이터 - 최소 / (최대 - 최소)노이즈 제거 방법정규화스무딩이산화 / 이동평균회귀계수독변 12개, 절편, 독립변수 1개 범주 3가지(3-1)*12 + 1원-핫 인코딩범주형 변수를 수치형 변수로 변환범주 간의 거리 계산 무의미변수간의 영향도 확인 가능비정형데이터 특성양이 많음, 다양한 형식과 구조 가짐(키컬도그), 데이터 레이크 사용NoSQL 도 사용클래스 불균형언더샘플링 혹은 오버샘플링으로 해결클래스 개수와 무관언더샘플링, 오버샘플링 조함 사용 가능파생변수기존 변수에 근거하여 새로운 변수 생성모델의 설명력을 향상, 예측능력을 개선BMI 계산머신러닝과 딥러닝딥러닝 주성분 분석(PCA)공분산 사용데이터 행렬을 비음.. 2024. 9. 3. 이전 1 다음 반응형