일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- cross join
- 머신러닝
- data analyst
- SQL
- 크롤링
- streamlit
- GA4
- 전처리
- If
- SQLD
- da
- 데이터분석
- jd
- 히트맵
- 군집화
- 서브쿼리
- 시각화
- pandas
- 클러스터링
- 최종 프로젝트
- 기초통계
- 태블로
- 기초프로젝트
- Chat GPT
- 데이터 분석
- Python
- lambda
- 프로젝트
- 팀프로젝트
- 프롬프트 엔지니어링
- Today
- Total
목록데이터 분석 (130)
세조목
실전 프로젝트를 진행하면서 태블로로 시각화할 때 계산식을 꽤 많이 활용하고있다. '두 명 이상의 ~~~', '두 가지 이상의 ~~~', 'user_id가 없는 ~~~'와 같은 조건들 말이다. python에서야 groupby 메서드로 a를 기준으로 b를 집계한 다음 그 값들을 가지고서 boolean 인덱싱하면 조건에 해당하는 값들을 쉽게 소팅할 수 있는데 태블로에서는 python에서와같은 방법을 활용할 수 없어서 많은 시간 고민을 해야했다. '계산된 필드 만들기' 가 방법이라는 것은 알고 있었지만 어떻게 계산식을 작성해야하는지가 문제였다. 아래 이미지는 금번 실전 프로젝트에서 우리가 풀어야 하는 과제인데 첫번째 문제를 보면 '두 명 이상의 unique user가 있는 세션의 수와 비율을 구하고 시각화화라'..
태블로를 활용하는 실전 프로젝트가 시작됐습니다. 저희 조는 이커머스 데이터 품질 검사를 주제로 프로젝트를 진행하기로했습니다. 오늘은 프로젝트 주제를 선정하고, GitHub 레포지토리를 개설했습니다. https://github.com/gabrietofu/B01_Data_Quality_Check 태블로에서 데이터 테이블을 결합하고 1번 문제를 살짝 맛보는 단계까지 진행했습니다. 테이블을 결합하는 과정에서 저희가 생각했을때 PK(Primary Key)라고 생각하는 user_id컬럼을 선택하면 아래와 같은 에러가 발생했습니다. 원인을 확인해본 결과 두 테이블 컬럼의 데이터 타입이 상이한것이 문제였습니다. 관련해서는 아래 포스팅에 정리해두었습니다. 2024.02.29 - [데이터 분석 공부/태블로] - 태블로 -..
이커머스 머신러닝 2024.02.27 - [데이터 분석 공부/머신러닝] - 이커머스 머신러닝 강의 복습(Ch.2 - Logistic Regression) 이커머스 머신러닝 강의 복습(Ch.2 - Logistic Regression) 테이블명.sum() → 컬럼별 수치의 합 전처리 data.isna().sum() 을 하면 결측치의 개수를 알 수 있음 결측치 처리 : data.dropna() impute 테이블명.fillna(변수) / 테이블명['컬럼명'].fillna(변수) 여기서 '변수'에 eyeoftheworld1209.tistory.com Python 예제 복습 자릿수 더하기 https://school.programmers.co.kr/learn/courses/30/lessons/12931 # 기존에 ..
테이블명.sum() → 컬럼별 수치의 합 전처리 data.isna().sum() 을 하면 결측치의 개수를 알 수 있음 결측치 처리 : data.dropna() impute 테이블명.fillna(변수) / 테이블명['컬럼명'].fillna(변수) 여기서 '변수'에는 평균이나 중앙값 등이 들어감 binary classification(이진 분류) 에서 linear를 사용할 수 없는 이유 선형으로 예측하면 1보다 크고, 0보다 작은 경우가 발생하는데 인지 아닌지를 보는 이진 분류에서 이는 말이되지 않음 이 때 logistic regression을 사용하면 예측값이 1과 0 사이에서 계산되기때문에 위에서의 문제가 해결됨 위 산식이 linear를 logistic으로 바꿔주는 산식임 1과 0 사이의 0.xxx의 값..