일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- da
- data analyst
- GA4
- 기초프로젝트
- 팀프로젝트
- SQL
- 전처리
- SQLD
- streamlit
- 최종 프로젝트
- 기초통계
- lambda
- 태블로
- 데이터 분석
- 시각화
- 프로젝트
- If
- 머신러닝
- jd
- 군집화
- pandas
- 클러스터링
- Chat GPT
- Python
- 서브쿼리
- 프롬프트 엔지니어링
- 크롤링
- cross join
- 데이터분석
- 히트맵
Archives
- Today
- Total
세조목
TIL(Today I Learned) 2일차(23.11.29) 본문
<5주차 복습 과정에서 발생한 의문점에 대한 답>
1. apply( ) 함수는 apply 안에 들어있는 데이터를 어떻게 적용할 것인가를 명시하는 부분이다.
grouping['user_id'].apply(pd.Series,nunique)가 의미하는 것은 'grouping 변수의 'user_id'라는 컬럼에 들어있는 값을
Series 형태로 중복 값 없이 명시해줘' 이다.
2. .reset_index( )
index( ) 를 적용시키기 전 'start_week'와 'week''는 index 상태이다.
이 두 데이터를 다시 데이터 항목(columns)으로 바꿔줘야하기때문에 index함수를 적용시키는 것이다.
3. for j in range(1, 6, 1):
retention.at[(w, j)] = retention.at[w,j] / retention.at[w,j-1]
for j in range( )에 1, 6, 1이 들어간다면 'retention.at[(w,0)]' 값은 어떻게 구하는건가?
range(1, 6, 1)에서 1과 6은 첫번째, 여섯번째를 의미한다.
retention[(w, 1), 'user_id']의 경우 w번째 주에 시작한 사람의 첫번째 주차를 의미한다.
python에서는 가장 처음 나오는 순서를 0으로 표시하는데 이 부분을 놓치고 있었기때문에 헷갈렸던 것이다.
<SQL 예제를 풀면서 학습한 내용>
1. having절은 group by절 다음에 나온다.
2. 조건을 걸때 where절에 조건을 적으면 되는데 count, sum과 같은 집계함수는 where절에 쓸 수 없기때문에 having절에 작성해야한다.
'데이터 분석 공부 > TIL(Today I Learned)' 카테고리의 다른 글
TIL(Today I Learned)6일차(23.12.05) (4) | 2023.12.05 |
---|---|
TIL(Today I Learned) 5일차(23.12.04) (0) | 2023.12.04 |
TIL(Today I Learned) 4일차(23.12.01) (2) | 2023.12.01 |
TIL(Today I Learned) 3일차(23.11.30) (2) | 2023.11.30 |
TIL(Today I Learned) 1일차(23.11.28) (0) | 2023.11.28 |