일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 전처리
- Chat GPT
- jd
- 기초프로젝트
- If
- 클러스터링
- 데이터분석
- 히트맵
- 팀프로젝트
- da
- SQLD
- 프로젝트
- 서브쿼리
- Python
- 프롬프트 엔지니어링
- 머신러닝
- 시각화
- lambda
- streamlit
- cross join
- GA4
- 기초통계
- pandas
- data analyst
- 데이터 분석
- 크롤링
- SQL
- 군집화
- 태블로
- 최종 프로젝트
- Today
- Total
목록데이터 분석 공부 (325)
세조목
여러 번 나눠서 돌려야하는 코드를 함수를 사용해서 한꺼번에 돌리는 경우가 종종 있습니다.금일 머신러닝 공부를 하면서도 그렇게 함수를 만들어서 코드를 돌렸는데요,이해가 되지 않는 부분이 있었습니다.def get_numeric_sc(df): from sklearn.preprocessing import StandardScaler, MinMaxScaler sd_sc = StandardScaler() mm_sc = MinMaxScaler() sd_sc.fit(train_df_2[['Fare']]) df['Fare_sd_sc'] = sd_sc.transform(df[['Fare']]) mm_sc.fit(train_df_2[['Age', 'Family']]) df[['Age_mm_sc', 'Family_..
SQL2024.05.08 - [데이터 분석 공부/SQL] - SQL 예제 정리('입양 시각 구하기(2)')(24.05.08) SQL 예제 정리('입양 시각 구하기(2)')(24.05.08)https://school.programmers.co.kr/learn/courses/30/lessons/59413 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는eyeoftheworld1209.tistory.com금일 복습한 SQL 예제는 재귀 함수를 활용하여 풀었습니다.오랜만에 보는 예제라 한번에 기억이 나지 않았는데다행히 기존에 작성했던 쿼리문을 참고하니 어떤식으로 풀어야하는지 이해됐습니다.자세한 내용은 위 포스팅에 정리해두었..
https://school.programmers.co.kr/learn/courses/30/lessons/59413 프로그래머스코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.programmers.co.kr0시부터 23시까지, 각 시간대별로 입양이 몇 건 발생했는지를 조회하는 것이 이번 예제의 요구사항입니다.간단한 요구사항인데 ANIMAL_OUTS 테이블에 포함된 시간을 확인해보니7시부터 19시까지밖에 없습니다.문제에서는 0시부터 23시까지라고 했으니 0~6시, 20~23시 데이터를 구해야합니다.어떻게 구할 수 있을까요? 다양한 방법이 있을 수 있겠지만 저는 재귀함수를 썼습니다.'재귀'란 자신에게로 다시..
머신러닝2024.05.07 - [데이터 분석 공부/머신러닝] - 머신러닝 심화 복습(결측치, 인코딩&스케일링)(24.05.07) 머신러닝 심화 복습(결측치, 인코딩&스케일링)(24.05.07)결측치표준편차가 크다 = 평균에서 벗어난 값들이 많다so 표준편차가 크다면 결측치를 평균값으로 대체하기보단 중앙값으로 대체하는게 낫다. ※ 범주형 데이터의 경우 최빈값으로 대체표준편eyeoftheworld1209.tistory.com2024.05.07 - [데이터 분석 공부/머신러닝] - 머신러닝 심화 복습(과적합)(24.05.07) 머신러닝 심화 복습(과적합)(24.05.07)과적합개념모형이 지나치게 복잡할 경우 데이터를 너무 많이(or 적게) 학습(=적합)해서특정 데이터의 예측만 할 수 있고, 다른 데이터는 예측..