일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Python
- GA4
- If
- data analyst
- streamlit
- lambda
- 머신러닝
- da
- 서브쿼리
- SQL
- 기초프로젝트
- 히트맵
- 프로젝트
- 데이터 분석
- pandas
- 프롬프트 엔지니어링
- 최종 프로젝트
- 시각화
- 군집화
- 크롤링
- 전처리
- jd
- cross join
- 팀프로젝트
- SQLD
- Chat GPT
- 클러스터링
- 데이터분석
- 기초통계
- 태블로
- Today
- Total
목록데이터 분석 공부 (325)
세조목
실전 프로젝트 2024.03.07 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 8일차(24.03.07) 실전 프로젝트 8일차(24.03.07) 1. 문제 풀기 실전 프로젝트 8일차입니다. 금일은 지옥 난이도 문제와 대시보드 작업을 진행했습니다. 지옥 난이도의 문제는 앞선 고급-2 문제의 연장선으로, 고급-2에서 세션의 간격이 30분이 넘 eyeoftheworld1209.tistory.com 실전 프로젝트 8일차였습니다. 마지막 지옥 난이도 문제 풀기와 대시보드 작업을 진행했으며 자세한 내용은 위 포스팅에 정리해두었습니다.
1. 문제 풀기 실전 프로젝트 8일차입니다. 금일은 지옥 난이도 문제와 대시보드 작업을 진행했습니다. 지옥 난이도의 문제는 앞선 고급-2 문제의 연장선으로, 고급-2에서 세션의 간격이 30분이 넘어가는 경우가 차지하는 비중이 어느정도인지 확인했다면 지옥 난이도에서는 30분이 넘어가는 이유에 대해서 확인해야했습니다. 우선 세션의 간격이 30분이 넘어가는 session_id들만을 별도로 확인해보았는데요, event_type에 하나의 패턴을 발견할 수 있었습니다. department-product-cart가 반복되는 패턴입니다. 여러가지 가설들을 세워보긴했으나 이렇다할 가설은 찾을수 없었습니다. 하지만 created_at 컬럼을 보았을때 각각의 event들간 간격이 짧은건 초 단위, 조금 긴건 분 단위인것으로..
실전 프로젝트 2024.03.06 - [데이터 분석 공부/프로젝트] - 실전 프로젝트 7일차(24.03.06) 실전 프로젝트 7일차(24.03.06) 실전 프로젝트 7일차입니다. 금일은 팀원들과 함께 (고급)-1, 2, 그리고 (지옥) 난이도 문제를 풀었습니다. (고급)-1의 경우 구매 시각 이전에 event가 발생했는지 여부를 확인해야했습니다. 태블로 eyeoftheworld1209.tistory.com 실전 프로젝트 7일차였습니다. 굉장히 많은, 그리고 밀도있는 회의시간을 가진 하루였는데요, 관련해서는 위 포스팅에 정리해두었습니다.
실전 프로젝트 7일차입니다. 금일은 팀원들과 함께 (고급)-1, 2, 그리고 (지옥) 난이도 문제를 풀었습니다. (고급)-1의 경우 구매 시각 이전에 event가 발생했는지 여부를 확인해야했습니다. 태블로 내에서 해당 작업을 수행하는 것에 어려움을 느껴 파이썬에서 전처리를 진행했는데요, 1. event 테이블 df = pd.read_csv('N:/개인/데이터 분석/내배캠/4. 실전 프로젝트/events.csv') # product_id 추출 event = df[df['uri'].str.contains('product/')] event_2 = event.uri.str.split('/') event_2 = event_2.str.get(2) event['uri_num'] = event_2 event_df = ..