일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이터분석
- 기초통계
- jd
- 머신러닝
- SQLD
- 기초프로젝트
- cross join
- GA4
- lambda
- 데이터 분석
- streamlit
- 프롬프트 엔지니어링
- 전처리
- 프로젝트
- da
- 히트맵
- 최종 프로젝트
- 팀프로젝트
- 서브쿼리
- data analyst
- If
- 시각화
- 군집화
- 태블로
- Python
- 클러스터링
- Chat GPT
- pandas
- 크롤링
- SQL
- Today
- Total
목록머신러닝 (30)
세조목
Step 데이터 불러와서 살펴보기 Sibsp(자녀수) + Parch(부모수) 이상치(Outlier) 처리 결측치 처리 인코딩(수치형 데이터) 스케일링(범주형 데이터) 로지스틱회귀(Logistic Regression) / 모델 평가 test 데이터에 적용 1. 데이터 불러와서 살펴보기 train_df = pd.read_csv('경로/train.csv') test_df = pd.read_csv('경로/test.csv') train_df.head(3) train_df.info() train_df.describe(include='all') 다양한 컬럼들이 존재하는데 이 중 'Age', 'Fare', 'Family', 'Embarked', 'Pcalss', 'Sex'를 독립변수로 'Survived'를 종속변수로 ..
머신러닝 2024.02.01 - [데이터 분석 공부/머신러닝] - 머신러닝 - 전처리(인코딩, 스케일링)(24.02.01) 머신러닝 - 전처리(인코딩, 스케일링)(24.02.01) 전처리(인코딩 & 스케일링) 인코딩이란 모델이 처리하기 쉬운 값으로 기존 값을 바꾸는 것을 의미한다. 범주형 데이터(Encoding) 레이블 인코딩(Label Encoding) One-Hot Encoding 수치형 데이터(Scaling) 표준 eyeoftheworld1209.tistory.com 2024.02.01 - [데이터 분석 공부/머신러닝] - 머신러닝 - 데이터 분리(feat. 과적합)(24.02.01) 머신러닝 - 데이터 분리(feat. 과적합)(24.02.01) 1. 과(대)적합 과대적합이란 데이터를 너무 과도하게..
1. 과(대)적합과대적합이란 데이터를 너무 과도하게 학습한 나머지 해당 문제만 잘 맞추고 새로운 데이터를 제대로 예측 혹은 분류하지 못하는 현상 을 의미한다.위 이미지의 첫번째 경우가 과(대)적합의 예시인데 주어진 데이터를 너무 과도하게 학습한 결과 위 예시와 같은 경우의 문제는 잘 맞추지만 나머지 문제들은 예측(or 분류)할 수 없게된다. 과(대)적합이 있다면 과(소)적합도 있을텐데 위 이미지의 가장 오른쪽 예시가 과(소)적합에 해당한다. 과(대)적합이 주어진 데이터를 너무 과도하게 학습한 결과라면 과(소)적합은 반대로 주어진 데이터를 충분히 학습하지 못함에 따른 결과다. 데이터가 충분하지 않거나, 모형이 지나치게 단수할 때 이런 과(소)적합이 발생한다. 2. 데이터 분할어떻게 이 문제를 해결할 수 있..
머신러닝 금일도 어제에 이어 머신러닝을 학습하고있습니다. 금일은 train data와 test data를 나누어서 결측치, 이상값을 제거하고 인코딩한 후 train data를 지도학습시켜 학습시킨 모델을 test data에 적용시켜 정확도를 확인해보는 연습을 했습니다. 아직 뭐가 뭔지 잘 모르겠지만 들어만봤던 머신러닝이라는 것이 이런 것이고, 이렇게 동작하는구나를 알 수 있어서 재밌었습니다. 금일 학습했던 내용은 내일 다시 한번 학습하고 나머지 머신러닝 강의들도 마저 학습할 예정입니다.