일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- pandas
- da
- 팀프로젝트
- 기초통계
- 프로젝트
- If
- jd
- 기초프로젝트
- 크롤링
- 최종 프로젝트
- Python
- 전처리
- lambda
- SQLD
- 군집화
- data analyst
- 서브쿼리
- streamlit
- 데이터분석
- cross join
- 머신러닝
- SQL
- 시각화
- 히트맵
- GA4
- 데이터 분석
- 프롬프트 엔지니어링
- Chat GPT
- 클러스터링
- 태블로
- Today
- Total
목록MSE (2)
세조목
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/3vJm7/btsFjWjoeUr/nQ80lKfwXm7VGqPJQSukD0/img.png)
1. 컬럼 제거 drop(제거할 열, axis=1, inplace=True) * inplace=True → '컬럼 제거하고 저장하겠다.' numpy array datatype은 연산 속도가 빠르기 때문에 대규모 데이터를 처리할 때에는 이 datatype을 사용해줘야 함 2. 행 인덱싱 index명으로 인덱싱할때는 loc 순서로 인덱싱할때는 iloc 3. 컬럼 인덱싱(순서로) 컬럼을 순서로 인덱싱하고싶다면 행 인덱싱 적어준 후 콤마 찍고 인덱싱하고싶은 컬럼의 순서에 해당하는 숫자를 적어주면 됨 df.iloc[1:4, 0:3] 4. Linear Regression(statsmodel 활용) train, test data 나누기 라이브러리 import import statsmodels.api as sm 변수에..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bjYqon/btsEfnn0sJj/hXV1Fz6nYpdK0mwC8HYVWk/img.png)
단순선형회귀 1. LinearRegression 함수 가져오기 from sklearn.linear_model import LinearRegression 2. 독립변수, 종속변수 준비 X = body_df[['weight']] y = body_df[['height']] 3. 학습시키기 model_lr = LinearRegression() model_lr.fit(X=X, y=y) 4. 가중치 & 편향 구하고 변수에 넣기 w1 = model_lr.coef_[0][0] >> array([[184.40385835], [179.22878362], [180.09129608], [188.71642061], [186.99139571], [161.97853455], [183.54134589], [166.29109682],..