일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- jd
- 최종 프로젝트
- cross join
- 머신러닝
- 기초프로젝트
- 태블로
- pandas
- 팀프로젝트
- data analyst
- Python
- 서브쿼리
- da
- 군집화
- 데이터분석
- 히트맵
- 프롬프트 엔지니어링
- 클러스터링
- streamlit
- 크롤링
- 전처리
- Chat GPT
- 기초통계
- SQL
- lambda
- 데이터 분석
- 시각화
- GA4
- If
- 프로젝트
- SQLD
- Today
- Total
목록전체 글 (328)
세조목
SQL, PYTHON 예제 복습 https://school.programmers.co.kr/learn/courses/30/lessons/12943 https://school.programmers.co.kr/learn/courses/30/lessons/12919 PYTHON 예제('서울에서 김서방 찾기', '콜라츠 추측')뿐만 아니라 SQL 예제(Immediate Food delivery 2)도 풀려고 시도했으나 SQL 예제는 풀지 못했습니다. 내일 다시 한번 시도해볼 예정입니다. SQLD(14주차) SQLD 강의 1차시 학습도 어느새 끝을 향해 가고 있습니다. 금일은 '옵티마이저', '실행계획', '인덱스', 그리고 '조인 수행 원리'를 학습했습니다. 전체적으로 각각의 개념들이 어떤 의미를 가지고 있는지..
SQL, PYTHON 예제 1. SQL https://leetcode.com/problems/immediate-food-delivery-ii/description/ WITH FIRST AS ( SELECT DELIVERY_ID, CUSTOMER_ID, ORDER_DATE, CUSTOMER_PREF_DELIVERY_DATE, RANK() OVER(PARTITION BY CUSTOMER_ID ORDER BY ORDER_DATE) RANKING FROM DELIVERY ), SECOND AS ( SELECT DELIVERY_ID, CUSTOMER_ID, ORDER_DATE, CUSTOMER_PREF_DELIVERY_DATE FROM FIRST WHERE RANKING = 1 ), THIRD AS ( SELEC..
심화 프로젝트 2024.02.08 - [데이터 분석 공부/프로젝트] - 심화 프로젝트 3일차(24.02.08) 심화 프로젝트 3일차(24.02.08) https://teamsparta.notion.site/GA4-A07-dd9d00d854d14427932272dce5d789ba 심화 프로젝트 3일차입니다. 금일은 튜터님과의 튜터링을 진행한 후 답변 내용을 참고하여 팀 회의를 진행했습니다. 질문에서도 확인할 수 eyeoftheworld1209.tistory.com SQLD 금일은 SQLD 12주차 학습과 심화프로젝트를 진행했습니다. SQLD 12주차에서는 '집합 연산자', '서브쿼리', 그리고 '기타 서브쿼리 & VIEW'를 학습했습니다. SQL 예제를 풀면서 한번씩 사용했던 개념들이다보니 이해하는데 어려..
https://teamsparta.notion.site/GA4-A07-dd9d00d854d14427932272dce5d789ba 심화 프로젝트 3일차입니다. 금일은 튜터님과의 튜터링을 진행한 후 답변 내용을 참고하여 팀 회의를 진행했습니다. 질문에서도 확인할 수 있듯이 개념 또는 측정 기준에 대한 내용들이 많습니다. 저희 팀의 경우 GA4로 수집한 로그 데이터를 가지고서 분석을 진행해야하는데 GA4의 개념들이 다소 생소했기때문입니다. 팀 회의간 질의응답했던 내용들을 팀원들에게 공유한 후 방향성을 정했습니다. 저희 팀은 각자 DAU, WAU, MAU 분석 유저별 평균접속시간 분포 방문 주차에따른 코호트 분석 코호트별 WEEKLY 리텐션 요일/시간대별 사용자 수 분석 를 진행하고 다음주 화요일에 각자 분석한..
https://www.notion.so/1-b5ad1ed6f85341709e3de365f816de0c 어제부터 심화 프로젝트가 시작됐습니다. 금일은 팀원들과 함께 데이터셋에대한 이야기, 측정기준에 대한 이야기를 간략하게 나누고 내일 있을 튜터링때 질문드릴 내용들을 공유했습니다. 저희가 사용하는 'train' dataset의 경우 json 형태의 속성값들이 다수 존재하여 json 형태를 각각의 컬럼으로 나누는 작업이 필요했습니다. def load_df(csv_path, nrows=None): JSON_COLUMNS = ['device', 'geoNetwork', 'totals', 'trafficSource'] df = pd.read_csv(csv_path, converters={column: json.lo..
Python 2024.02.07 - [데이터 분석 공부/Python] - Python 정리(데이터 카운팅)(24.02.07) Python 정리(데이터 카운팅)(24.02.07) 위와 같은 시리즈 a가 있다. 1. 테이블명.count() count는 데이터의 전체 개수를 세아리는 함수다. 시리즈 a에 속해있는 전체 데이터의 개수는 4개이므로 숫자 4가 출력된다. 데이터프레임의 경우 아 eyeoftheworld1209.tistory.com 심화 프로젝트 https://www.notion.so/1-b5ad1ed6f85341709e3de365f816de0c 어제부터 심화 프로젝트가 시작됐습니다. 금일은 팀원들과 함께 데이터셋에대한 이야기, 측정기준에 대한 이야기를 간략하게 나누고 내일 있을 튜터링때 질문드릴 내..
위와 같은 시리즈 a가 있다. 1. 테이블명.count() count는 데이터의 전체 개수를 세아리는 함수다. 시리즈 a에 속해있는 전체 데이터의 개수는 4개이므로 숫자 4가 출력된다. 데이터프레임의 경우 아래와 같이 코드를 입력하면 해당 컬럼에 속한 속성값들의 개수만을 counting할 수 있다. 테이블명['컬럼명'].count() 2. 테이블명 .Size count와 size모두 속성값의 개수를 세아린다는 점에서는 동일하지만 count는 결측치를 제외하고서, size는 결측치를 포함하고서 counting한다는 차이점과 count는 뒤에 소괄호를 넣고, size는 소괄호를 넣지 않는다는 차이점을 가진다. 3. 테이블명.value_counts() 지정한 열이나 행의 개수(빈도수)를 구해주는 메소드다. 만..
이커머스 데이터 분석 2024.02.06 - [데이터 분석 공부/이커머스 데이터 분석] - AARRR - 리텐션(클래식 리텐션 / Classic Retention) AARRR - 리텐션(클래식 리텐션) https://datarian.io/blog/classic-retention 리텐션 (1) Classic Retention AARRR 프레임워크에서 가장 중요한 Retention, 사용자 유지와 관련한 지표 계산에 대해서 알아봅시다. datarian.io ※ 이 포스팅은 위 클래식 리 eyeoftheworld1209.tistory.com 2024.02.06 - [데이터 분석 공부/이커머스 데이터 분석] - AARRR - 리텐션(롤링 리텐션 / Rolling Retention) AARRR - 리텐션(롤링 리..
https://datarian.io/blog/rolling-retention 리텐션 (2) Rolling Retention 롤링 리텐션은 '사용자가 이탈하지 않고 남아있는가?'에 초점을 맞추기 때문에 Unbounded Retention 이라고도 부릅니다. datarian.io ※ 이 포스팅은 위 포스팅을 보며 학습한 내용을 정리하기위해 작성했습니다. 롤링 리텐션은 '사용자가 이탈하지 않고 남아있는가?' 에 초점을 맞추기때문에 Unbounded Retention이라고도 불린다. 롤링 리텐션은 마지막 방문일 이전은 방문한 것으로 간주하기때문에 기준일을 포함하여 그 이후에 한 번이라도 재방문한 유저들의 비율을 나타낸다. 아래 예시를 살펴보자 24.02.06 (Day 0) 24.02.07 (Day 1) 24.0..
https://datarian.io/blog/classic-retention 리텐션 (1) Classic Retention AARRR 프레임워크에서 가장 중요한 Retention, 사용자 유지와 관련한 지표 계산에 대해서 알아봅시다. datarian.io ※ 이 포스팅은 위 클래식 리텐션 정리 포스팅을 공부하며 정리한 내용들을 담았습니다. 리텐션의 중요성 AARRR Acquisition : 사용자 획득 Activation : 사용자 활성화(서비스를 사용하기 시작) Retention : 사용자 유지(지속적으로 서비스를 사용) Revenue : 매출(구매) Referral : 전파(지인 추천) 이 중 가장 중요하며 가장 먼저 개선해야하는 단계는 어디일까? 바로 세번째 단계인 Rretention이다. why?..