본문 바로가기
반응형

도전기/빅분기11

008_빅분기 테스트환경 외부데이터 활용 # 출력을 원할 경우 print() 함수 활용 # 예시) print(df.head()) # getcwd(), chdir() 등 작업 폴더 설정 불필요 # 파일 경로 상 내부 드라이브 경로(C: 등) 접근 불가 import pandas as pd from io import StringIOdata = """ # 데이터 붙여넣을 영역 """ df = pd.read_csv(StringIO(data)) print(df.head()) # df = pd.read_csv("data/mtcars.csv") # 사용자 코딩 # 해당 화면에서는 제출하지 않으며, 문제 풀이 후 답안제출에서 결괏값 제출코드 구조 분석1. import pandas as pdpandas 라이브러리를 pd라는 약어로 가져옵니다. 이 약어는 데이터를.. 2024. 11. 24.
009_빅분기 실기 시험 환경 업데이트 정보 패기지 업데이트_11.30 (0. Python 3.12,Pandas 2.2.2, scikit-learn 1.5.2, scipy 1.14.1, statsmodels 0.14.1, LightGBM 4.5.0)   0. Python 3.12의 주요 특징  성능 향상다양한 내부 최적화로 인해 Python 3.11보다 실행 속도가 더욱 빨라졌습니다. 특히 CPython 인터프리터의 성능을 개선하여 더 효율적인 실행을 제공합니다.  에러 메시지 개선예외 메시지가 더 명확해졌으며, 디버깅이 쉬워졌습니다. 예를 들어, 문법 오류(SyntaxError)의 원인 분석이 더욱 상세하게 출력됩니다.  새로운 기능 및 문법 type()으로 직접 유효성 검사: 더 유연한 타입 검사 및 사용자 정의 타입 지원. 매개변수에서 Lit.. 2024. 11. 24.
003_제3유형_구름 기반 실습 import pandas as pd from scipy.stats import chi2_contingency # Load the Titanic dataset df = pd.read_csv("data/Titanic.csv") # Create a contingency table for 'Gender' and 'Survived' table = pd.crosstab(df['Gender'], df['Survived']) # Perform the chi-squared test statistics, p, degrees_of_freedom, expected = chi2_contingency(table) # Print the chi-squared statistic rounded to 3 decimal placesprin.. 2024. 11. 12.
002_제2유형_구름 기반 실습 체험 제2유형import pandas as pd train = pd.read_csv("data/customer_train.csv") test = pd.read_csv("data/customer_test.csv")   #1. 데이터 유형 파악  print(train.info())print(test.info())> RangeIndex: 3500 entries, 0 to 3499Data columns (total 11 columns): #   Column   Non-Null Count  Dtype  ---  ------   --------------  -----   0   회원ID     3500 non-null   int64   1   총구매액     3500 non-null   int64   2   최대구.. 2024. 11. 11.
001_1유형_test 데이터 다루기 유형1. 데이터 타입2. 기초통계량3. 인덱싱4. 결측치, 이상치, 중복값 처리5. 데이터 스케일링6. 데이터 병합7. 날짜/시간 데이터 처리, 인덱스 처리  import pandas as pd import numpy as np df = pd.read_csv("data/mtcars.csv") # 사용자 코딩 df.head() print(df.head()) Q1 = df['mpg'].quantile(0.25) Q2 = df['mpg'].quantile(0.5) Q3 = df['mpg'].quantile(0.75) Q4 = df['mpg'].quantile(1) print(round(Q1)) print(Q1) print(round(Q1,2)) print(round(Q2)) print(Q3) p.. 2024. 10. 9.
002_빅데이터분석기사 실기_단기간_합격_준비 빅데이터분석기사 실기를 단기간에 준비하는 방법을 고민해 보았습니다. 핵심 전략 1. 작업형 문제 위주로 집중 연습 2. 만능 코드 템플릿 활용 3. 기출문제 및 예상문제 반복 풀이 세부 준비 방법 작업형 제1유형 대비 데이터 전처리와 기본적인 분석 기법에 집중하기주요 단계: 데이터 파일 읽기 불필요한 칼럼 삭제 결측치 처리 라벨인코딩 (필요시) 모델링 및 검증* 파이썬 pandas 라이브러리 사용법을 숙지하기작업형 제2유형 대비 시간 제약이 있으므로, 효율적인 코드 작성이 중요함, 자주 출제되는 알고리즘과 모델을 중심으로 준비.. 랜덤 포레스트.. 만능 모델 성능 확인을 위해 Train 데이터를 분할하여 검증하는 방법을 숙지 실전 연습공개된 예상문제와 기출문제를 반복적으로 풀어보기.. dataq 테스트 .. 2024. 10. 2.
000_빅데이터 분석기사_필기_합격수기_ADP비교 빅데이터 분석기사 자격증 필요한가?빅데이터 분석기사는 데이터 분석에 대한 전문성을 평가하는 국가기술자격증입니다.주로 대량의 데이터를 수집, 처리, 분석하는 능력과 그 데이터를 통해 의미 있는 인사이트를 도출하는 능력을 검증합니다. 빅데이터는 다양한 산업에서 매우 중요한 자원으로 간주되기 때문에, 이 자격증은 빅데이터 분석 전문가로서의 기초 지식을 의미합니다.빅데이터 분석기사의 주요 특징:시험 과목:1차 필기 시험: 빅데이터 분석 개요, 데이터 수집·처리, 데이터 분석 방법론, 데이터 시각화 등 이론적 지식을 평가합니다.2차 실기 시험: 빅데이터 분석 실무 능력을 평가하며, 데이터를 실제로 처리하고 분석하는 능력을 중점적으로 평가합니다.응시 대상: 데이터 분석을 다루는 모든 직종에서 근무하는 사람을 포함하.. 2024. 9. 22.
혼공_DAY_04_빅데이터 결과 해석 SVM의 하이퍼 파라미터 최적화leave one out 두명의 분석가의 분석결과를 동일하게 하기 위한 방법5 fold 교차 검증T- V- T 부트 스트래핑초매개변수 튜닝그리드 서치 : 가능한 모든 조합 시도랜덤 서치 : 정해진 범위내 랜덤하게 변수 추출 시도베이지안 최적화 : 이전에 학습한 결과를 참고하여 초매개변수 설정혼동행렬 정확도 TP+TN / all정밀도 TP / TP+FPF1 정밀도 재현율의 조화평균재현율 TP / TP+FN군집의 수 지정 지정하지 않아도 되는것가우시안 믹쳐 모델(Gaussian Mixture Model) K 개 군집수 지정DBSCAN 밀도 기반 알고리즘인포그래픽 유형타임라인 : 역사적 사건이나 PJ 진행 상황 등을 시간 순으로 나열하여 전달콘셉트 맵 : 주제, 내용의 연관성을 .. 2024. 9. 4.
반응형