일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- data analyst
- 데이터 분석
- 기초통계
- 프로젝트
- 클러스터링
- SQLD
- 시각화
- GA4
- 군집화
- 전처리
- 최종 프로젝트
- 데이터분석
- pandas
- 팀프로젝트
- lambda
- 프롬프트 엔지니어링
- streamlit
- 기초프로젝트
- SQL
- Python
- 머신러닝
- cross join
- 서브쿼리
- da
- 크롤링
- Chat GPT
- jd
- If
- 태블로
- 히트맵
- Today
- Total
목록전체 글 (328)
세조목
GA4 2024.02.05 - [데이터 분석 공부/GA4] - GA4 정리(전환율, 'not provided', UTM)(24.02.05) SQLD 기초통계 금일은 지난 한 주간 머신러닝을 공부하느라 공부하지 못했던 GA4, 기초통계, 그리고 SQLD를 학습했습니다. SQLD를 제외한 GA4와 기초통계는 이전에 학습했던 내용들을 간략하게 복습하고 그 다음 파트 공부를 진행했습니다. 내일부터는 팀 프로젝트가 진행되다보니 강의 학습이 다소 지연될수는 있는데 짬짬이 학습할 수 있도록 시간 분배할 예정입니다.
용어 정리 1. 전환율 이벤트 수 / 사용자 수 이벤트 수 / 세션 수 2. not provided : 구글 검색을 통해 유입되는 경우인데 개인보호 정책 상 'not provided'로 표기된다. UTM 으로 표시되는 경우가 있다. 아래 9가지에 해당하는 경우 (direct) / (none)으로 표시된다. (direct) / (none)이 많으면 좋냐 나쁘냐를 말하기가 애매하긴하지만 유입됐던 경로에 대한 정보가 없으면 마케팅 전략을 수립하고, 성과판단을 하기가 어렵기때문에 그런 측면에서는 (direct) / (none)이 많다는건 좋지 않다고 할 수 있다. 따라서 온라인 광고를 집행할때 별도의 꼬리표(태그)를 붙여서 해당 광고를 보고서 랜딩 페이지에 도달한 사람들의 수가 어느정도 되는지 파악할 필요가 있..
머신러닝 개인과제 금일은 어제 진행했던 머신러닝 개인과제를 최종적으로 확인 한 후 제출까지 완료했습니다. 선택형 문제 풀이 과정에서 왜 np.log() 가 아닌 np.log1p() 를 사용했는지에 대해서 고민했는데 확인 결과 로그에 0.00000n 값이 들어가면 결과값은 음의 무한대에 가까워지기때문에 값에다 1을 더한 값을 로그에 넣기위해 np.log1p() 를 사용한다는 것을 학습했습니다. SQL, PYTHON 예제 복습 1시간 정도 SQL, PYTHON 예제를 복습했습니다. SQL의 경우 Leetcode의 'Not Boring Movies' 문제를, https://leetcode.com/problems/not-boring-movies/description/ Python의 경우 프로그래머스의 'x만큼 ..
Python 금일은 머신러닝 개인과제를 수행했습니다. 과제를 수행하며 새롭게 학습한 함수들을 간략하게 정리했습니다. 2024.02.03 - [데이터 분석 공부/Python] - Python 정리(속성값 변경, 차원 확인, enumerate)(24.02.03) Python 정리(속성값 변경, 차원 확인, enumerate)(24.02.03) 속성값 변경 df['컬럼명'] = df['컬럼명'].replace('기존값', '수정값') ex) df['name'] = df['name'].replace('Joe', 'Kane') 차원 확인(shape) 변수명.shape 분리한 데이터셋의 차원을 볼 수 있음 차원이란 '데이터셋에 eyeoftheworld1209.tistory.com 시간 관계상 미처 정리하지 못한 부..
속성값 변경 df['컬럼명'] = df['컬럼명'].replace('기존값', '수정값') ex) df['name'] = df['name'].replace('Joe', 'Kane') ※ 특정 열의 특정 값만 바꾸고자 할 때 df.replace({컬럼명 : 기존값}, 수정값) 차원 확인(shape) 변수명.shape 분리한 데이터셋의 차원을 볼 수 있음 차원이란 '데이터셋에 포함된 값의 개수', '독립변수의 개수'를 의미함 다시말해 행과 열의 개수를 알려준다. shape는 속성이기때문에 ()를 붙여주면 안 된다. enumerate enumerate 함수는 리스트의 원소에 인덱스를 부여하는 기능을 가지고있다. 예를들어 df = ['food', 'animal', 'date', 'people'] 라는 리스트가 ..
금주의 총점은 77.75점으로 지난주 85.0점보다 -8.53% 하락했습니다. 2주 연속 점수가 하락했습니다. 지난주의 경우 미래에 대한 불안감, 기초통계 공부에 생각보다 많은 시간을 할애함에따라 계획했던 일들을 모두 수행하지 못하였는데 이번주의 경우는 주 초반에 머신러닝 학습 外 다른 계획도 수립했는데 생각보다 머신러닝 학습에 많은 시간이 소요됨에따라 계획했던 일들을 수행하지 못함에따라 점수가 낮아졌습니다. 그래도 저번에 비해서는 컨디션도 좋았고, 禪의 상태에 더 많이 들어갈수 있어서 지난주 보다 점수는 낮아졌을지라도 만족도는 더 높다고 생각합니다. 다음으로 금주 학습했던 내용에 대한 정리입니다. SQL 2024.02.01 - [데이터 분석 공부/SQL] - SQL 정리(Join의 기준)(24.02.0..
SQL 2024.02.02 - [데이터 분석 공부/SQL] - SQL 예제 풀이(Leetcode - Confirmation Rate) SQL 예제 풀이(Leetcode - Confirmation Rate) https://leetcode.com/problems/confirmation-rate/description/ LeetCode - The World's Leading Online Programming Learning Platform Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your n eyeoftheworld1209.tistory...
목차 의사결정나무 랜덤 포레스트 KNN(최근접 이웃) 부스팅 알고리즘 1. 의사결정나무 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.preprocessing import LabelEncoder from sklearn.tree import DecisionTreeClassifier, plot_tree titanic_df = pd.read_csv('경로.csv') 의사결정나무를 만들려면 sklearn.tree 라이브러리의 DecisionTreeClassifier 클래스를 가져와야한다. X_features = ['Pclass', 'Sex', 'Age', 'Fare', 'Embarked'] # 평균으로 ..
Step 데이터 불러와서 살펴보기 Sibsp(자녀수) + Parch(부모수) 이상치(Outlier) 처리 결측치 처리 인코딩(수치형 데이터) 스케일링(범주형 데이터) 로지스틱회귀(Logistic Regression) / 모델 평가 test 데이터에 적용 1. 데이터 불러와서 살펴보기 train_df = pd.read_csv('경로/train.csv') test_df = pd.read_csv('경로/test.csv') train_df.head(3) train_df.info() train_df.describe(include='all') 다양한 컬럼들이 존재하는데 이 중 'Age', 'Fare', 'Family', 'Embarked', 'Pcalss', 'Sex'를 독립변수로 'Survived'를 종속변수로 ..
https://leetcode.com/problems/confirmation-rate/description/ LeetCode - The World's Leading Online Programming Learning Platform Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com Signups와 Confirmations 두 테이블이 있다. 두 테이블을 가지고서 각 유저별 confirm받은 비율을 구하는 것이 문제의 요구사항이다. confirm받을 비율을 구하기 위해서는 각 유저별로..