일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 프롬프트 엔지니어링
- 데이터 분석
- da
- 시각화
- 크롤링
- 팀프로젝트
- 태블로
- 전처리
- streamlit
- 데이터분석
- If
- 기초통계
- lambda
- 머신러닝
- Chat GPT
- SQL
- 히트맵
- Python
- pandas
- cross join
- 서브쿼리
- data analyst
- jd
- 최종 프로젝트
- 기초프로젝트
- 클러스터링
- SQLD
- 프로젝트
- GA4
- 군집화
- Today
- Total
목록로지스틱회귀 (3)
세조목
Step 데이터 불러와서 살펴보기 Sibsp(자녀수) + Parch(부모수) 이상치(Outlier) 처리 결측치 처리 인코딩(수치형 데이터) 스케일링(범주형 데이터) 로지스틱회귀(Logistic Regression) / 모델 평가 test 데이터에 적용 1. 데이터 불러와서 살펴보기 train_df = pd.read_csv('경로/train.csv') test_df = pd.read_csv('경로/test.csv') train_df.head(3) train_df.info() train_df.describe(include='all') 다양한 컬럼들이 존재하는데 이 중 'Age', 'Fare', 'Family', 'Embarked', 'Pcalss', 'Sex'를 독립변수로 'Survived'를 종속변수로 ..
1. 데이터 불러오기 titanic_df = pd.read_csv('경로', encoding = 'utf-8') * encoding의 경우 필요한 경우에만 2. 독립변수, 종속변수 지정 X = titanic_df[['Fare']] >> 클래스 종류 [0 1] 독립변수 갯수 1 들어간 독립변수(x)의 이름 ['Fare'] 가중치 [[0.01519617]] 바이어스 [-0.94129222] 7. 분류평가지표(정확도 & f1 score) 확인하기 from sklearn.metrics import accuracy_score, f1_score def get_metrics(true, pred): print('정확도', accuracy_score(true, pred)) print('f1_score', f1_score..
머신러닝 2024.01.31 - [데이터 분석 공부/Python] - Python 정리(머신러닝-단순&다중선형회귀)(24.01.30) Python 정리(머신러닝-단순&다중선형회귀)(24.01.30) 단순선형회귀 1. LinearRegression 함수 가져오기 from sklearn.linear_model import LinearRegression 2. 독립변수, 종속변수 준비 X = body_df[['weight']] y = body_df[['height']] 3. 학습시키기 model_lr = LinearRegression() model_lr.fit( eyeoftheworld1209.tistory.com 이번 주차는 '머신 러닝' 학습 주차입니다. 금일은 '단순&다중 선형회귀'와 '로지스틱 회귀'를 ..