일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 데이터 분석
- 군집화
- SQLD
- 머신러닝
- 기초프로젝트
- jd
- 서브쿼리
- streamlit
- 전처리
- data analyst
- 데이터분석
- GA4
- da
- If
- 최종 프로젝트
- 프롬프트 엔지니어링
- 프로젝트
- 히트맵
- SQL
- Python
- 팀프로젝트
- 태블로
- Chat GPT
- cross join
- 기초통계
- 시각화
- 크롤링
- pandas
- 클러스터링
- lambda
- Today
- Total
목록선형회귀 (2)
세조목
머신러닝2024.05.02 - [데이터 분석 공부/머신러닝] - 머신러닝 기초 복습(선형회귀)(24.05.02) 머신러닝 기초 복습(선형회귀)(24.05.02)실제값과 예측값의 차이 = ErrorError = ∑Error ^2→ 제곱하는 이유 : 음수 제거→ 데이터가 추가될 때마다 Error가 커진다는 문제가 있음 → 해결 방법 : Error / 전체 데이터 개수 ※ 편향(베타 제로eyeoftheworld1209.tistory.com SQL2024.05.02 - [데이터 분석 공부/SQL] - SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기') SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기')https://school.programmers.co...
1. 컬럼 제거 drop(제거할 열, axis=1, inplace=True) * inplace=True → '컬럼 제거하고 저장하겠다.' numpy array datatype은 연산 속도가 빠르기 때문에 대규모 데이터를 처리할 때에는 이 datatype을 사용해줘야 함 2. 행 인덱싱 index명으로 인덱싱할때는 loc 순서로 인덱싱할때는 iloc 3. 컬럼 인덱싱(순서로) 컬럼을 순서로 인덱싱하고싶다면 행 인덱싱 적어준 후 콤마 찍고 인덱싱하고싶은 컬럼의 순서에 해당하는 숫자를 적어주면 됨 df.iloc[1:4, 0:3] 4. Linear Regression(statsmodel 활용) train, test data 나누기 라이브러리 import import statsmodels.api as sm 변수에..