일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 팀프로젝트
- 태블로
- 프롬프트 엔지니어링
- da
- pandas
- 크롤링
- 전처리
- 시각화
- SQL
- 서브쿼리
- Chat GPT
- 데이터분석
- SQLD
- 최종 프로젝트
- 데이터 분석
- 프로젝트
- 군집화
- cross join
- Python
- lambda
- 머신러닝
- jd
- 히트맵
- 기초프로젝트
- data analyst
- 기초통계
- streamlit
- GA4
- If
- 클러스터링
Archives
- Today
- Total
목록덴드로그램 (1)
세조목
머신러닝 - 클러스터링(계층적 군집화)
1. 계층적 군집화 상향식 군집화(일반적임) 하향식 군집화 장점 군집의 갯수를 정해줄 필요가 없다. 군집 간 계층적 관계를 찾아낼 수 있다. 방법 Single Linkage : 두 군집 사이 최소 거리 이용 Complete Linkage : 두 군집 사이 최대 거리 이용 Average Linkage : 포인트와 포인트 사이 모든 거리의 평균 Centroid Linkage : 각 군집의 centroid(무게 중심) 값 사이 거리 Ward Linkage(가장 많이 사용되며 계층적 군집화 라이브러리 기본값으로 지정되어있음) 클러스터 내 각각의 centroid와 거리의 제곱합(SSE) 계산 두 클러스터를 하나의 군집으로 만들었을 때의 새로운 평균과의 거리제곱합 계산 그 차이 = Ward Distance / 이 ..
데이터 분석 공부/머신러닝
2024. 4. 2. 12:06