일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Chat GPT
- 데이터분석
- 히트맵
- 최종 프로젝트
- cross join
- 기초프로젝트
- streamlit
- 클러스터링
- lambda
- GA4
- 군집화
- da
- 크롤링
- Python
- 머신러닝
- 프롬프트 엔지니어링
- SQL
- 전처리
- pandas
- jd
- 서브쿼리
- 데이터 분석
- SQLD
- 프로젝트
- 시각화
- If
- 팀프로젝트
- data analyst
- 기초통계
- 태블로
- Today
- Total
목록머신러닝 (30)
세조목
머신러닝예측숫자{(평균으로)회귀}범주/카테고리(분류)선형 회귀로지스틱 회귀선형 회귀를 차용해서 만든거라서 '회귀'가 붙음 다중공선성 제거 방법1. pair plot, 상관관계로 상관관계 확인 후 하나의 독립변수 제거2. PCA(차원축소) 로지스틱 회귀로지스틱 회귀 : 확률 예측 時 사용됨그림에서 확인할 수 있는대로 확률을 예측할 때는 선형회귀를 적용하는 것이 적절하지 않음그래서 0과 1에 수렴하는 Logistic Regression이 나왔음 오즈비 = p / 1-p ※ 오즈비의 경우 확률이 증가할수록 급격히 발산하기 때문에 사용이 적절하지 않음오즈비 + 로그 → 로짓(Logit) = log(p / 1-p) ※ 로그를 씌워주면 회귀모델로 사용하기에 적절하게 됨로지스틱 회귀의 임계값 → 0.5(0.5 넘으면..
머신러닝2024.05.02 - [데이터 분석 공부/머신러닝] - 머신러닝 기초 복습(선형회귀)(24.05.02) 머신러닝 기초 복습(선형회귀)(24.05.02)실제값과 예측값의 차이 = ErrorError = ∑Error ^2→ 제곱하는 이유 : 음수 제거→ 데이터가 추가될 때마다 Error가 커진다는 문제가 있음 → 해결 방법 : Error / 전체 데이터 개수 ※ 편향(베타 제로eyeoftheworld1209.tistory.com SQL2024.05.02 - [데이터 분석 공부/SQL] - SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기') SQL 예제 정리('자동차 대여 기록에서 대여 중/대여 가능 여부 구분하기')https://school.programmers.co...
머신러닝(클러스터링) 2024.04.02 - [데이터 분석 공부/머신러닝] - 머신러닝 - 클러스터링(계층적 군집화) 머신러닝 - 클러스터링(계층적 군집화) 1. 계층적 군집화 상향식 군집화(일반적임) 하향식 군집화 장점 군집의 갯수를 정해줄 필요가 없다. 군집 간 계층적 관계를 찾아낼 수 있다. 방법 Single Linkage : 두 군집 사이 최소 거리 이용 Complete eyeoftheworld1209.tistory.com 최종 프로젝트 2024.04.02 - [데이터 분석 공부/프로젝트] - 최종 프로젝트 7일차(24.04.02) 최종 프로젝트 7일차(24.04.02) 최종 프로젝트 7일차입니다. 금일은 가게명을 클릭하고 플레이스 페이지가 열림과 동시에 전혀 다른 페이지가 함께 열리는 오류와 리..
1. 계층적 군집화 상향식 군집화(일반적임) 하향식 군집화 장점 군집의 갯수를 정해줄 필요가 없다. 군집 간 계층적 관계를 찾아낼 수 있다. 방법 Single Linkage : 두 군집 사이 최소 거리 이용 Complete Linkage : 두 군집 사이 최대 거리 이용 Average Linkage : 포인트와 포인트 사이 모든 거리의 평균 Centroid Linkage : 각 군집의 centroid(무게 중심) 값 사이 거리 Ward Linkage(가장 많이 사용되며 계층적 군집화 라이브러리 기본값으로 지정되어있음) 클러스터 내 각각의 centroid와 거리의 제곱합(SSE) 계산 두 클러스터를 하나의 군집으로 만들었을 때의 새로운 평균과의 거리제곱합 계산 그 차이 = Ward Distance / 이 ..