일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 기초프로젝트
- 태블로
- 머신러닝
- 히트맵
- 기초통계
- 전처리
- SQLD
- If
- 크롤링
- Python
- streamlit
- 클러스터링
- 프로젝트
- 프롬프트 엔지니어링
- 데이터 분석
- da
- 군집화
- cross join
- SQL
- 데이터분석
- GA4
- pandas
- 팀프로젝트
- 시각화
- lambda
- 최종 프로젝트
- 서브쿼리
- Chat GPT
- jd
- data analyst
- Today
- Total
목록머신러닝 (30)
세조목
이커머스 머신러닝 2024.02.27 - [데이터 분석 공부/머신러닝] - 이커머스 머신러닝 강의 복습(Ch.2 - Logistic Regression) 이커머스 머신러닝 강의 복습(Ch.2 - Logistic Regression) 테이블명.sum() → 컬럼별 수치의 합 전처리 data.isna().sum() 을 하면 결측치의 개수를 알 수 있음 결측치 처리 : data.dropna() impute 테이블명.fillna(변수) / 테이블명['컬럼명'].fillna(변수) 여기서 '변수'에 eyeoftheworld1209.tistory.com Python 예제 복습 자릿수 더하기 https://school.programmers.co.kr/learn/courses/30/lessons/12931 # 기존에 ..
테이블명.sum() → 컬럼별 수치의 합 전처리 data.isna().sum() 을 하면 결측치의 개수를 알 수 있음 결측치 처리 : data.dropna() impute 테이블명.fillna(변수) / 테이블명['컬럼명'].fillna(변수) 여기서 '변수'에는 평균이나 중앙값 등이 들어감 binary classification(이진 분류) 에서 linear를 사용할 수 없는 이유 선형으로 예측하면 1보다 크고, 0보다 작은 경우가 발생하는데 인지 아닌지를 보는 이진 분류에서 이는 말이되지 않음 이 때 logistic regression을 사용하면 예측값이 1과 0 사이에서 계산되기때문에 위에서의 문제가 해결됨 위 산식이 linear를 logistic으로 바꿔주는 산식임 1과 0 사이의 0.xxx의 값..
PYTHON 예제 https://school.programmers.co.kr/learn/courses/30/lessons/68935 2024.02.26 - [데이터 분석 공부/Python] - Python 예제(3진법 뒤집기) def solution(n): answer = ' ' while n > 0: n, re = divmod(n,3) answer += str(re) return int(answer, 3) SQLD(12주차) 학습 이커머스 머신러닝 2024.02.26 - [데이터 분석 공부/머신러닝] - 이커머스 머신러닝 강의 복습(Ch.1 - Linear Regression) 이커머스 머신러닝 강의 복습(Ch.1 - Linear Regression) 1. 컬럼 제거 drop(제거할 열, axis=1,..
1. 컬럼 제거 drop(제거할 열, axis=1, inplace=True) * inplace=True → '컬럼 제거하고 저장하겠다.' numpy array datatype은 연산 속도가 빠르기 때문에 대규모 데이터를 처리할 때에는 이 datatype을 사용해줘야 함 2. 행 인덱싱 index명으로 인덱싱할때는 loc 순서로 인덱싱할때는 iloc 3. 컬럼 인덱싱(순서로) 컬럼을 순서로 인덱싱하고싶다면 행 인덱싱 적어준 후 콤마 찍고 인덱싱하고싶은 컬럼의 순서에 해당하는 숫자를 적어주면 됨 df.iloc[1:4, 0:3] 4. Linear Regression(statsmodel 활용) train, test data 나누기 라이브러리 import import statsmodels.api as sm 변수에..