일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- pandas
- 기초통계
- SQL
- 프롬프트 엔지니어링
- 프로젝트
- jd
- Chat GPT
- Python
- 데이터 분석
- 서브쿼리
- 데이터분석
- 최종 프로젝트
- lambda
- 전처리
- 군집화
- 팀프로젝트
- 태블로
- 머신러닝
- 클러스터링
- SQLD
- 시각화
- GA4
- cross join
- 기초프로젝트
- If
- streamlit
- 크롤링
- data analyst
- 히트맵
- da
Archives
- Today
- Total
세조목
TIL(Today I Learned) 89일차(24.03.12)(str.contains, str.split, str.get, sort_values, fillna(timedelta()), index_col=0) 본문
데이터 분석 공부/TIL(Today I Learned)
TIL(Today I Learned) 89일차(24.03.12)(str.contains, str.split, str.get, sort_values, fillna(timedelta()), index_col=0)
세조목 2024. 3. 12. 20:40Python
2024.03.12 - [데이터 분석 공부/Python] - Python - 긴 코드의 가독성 높이기(역슬래시, 메서드 체이닝)
기타 학습 사항
1. 특정 문자 포함된 속성값들만 indexing하기
product_split = events2[events2['uri'].str.contains('product/')]
2. '/'를 기준으로 속성값 나누기
product_split = product_split.uri.str.split('/')
3. 특정 순서의 값 가져오기
product_id = product_split.str.get(2)
4. 특정 컬럼을 기준으로 정렬하기
events2.sort_values(by = ['session_id', 'created_at'], ascending = True, inplace=True)
5. Null값 채워넣기
events2['date_diff'] = events2['date_diff'].fillna(pd.Timedelta(0))
: fillna 소괄호 안에 pd.Timedelta(0)을 적은 이유는
date_diff 컬럼의 경우 timedelta type으로 int type인 0이 들어갈 수 없기때문에
0을 timedelta type으로 변경해줄 필요가 있었기 때문이다.
6. csv 파일 불러올때 index없이 불러오기
final = pd.read_csv('merge_product_head.csv', index_col=0)
'데이터 분석 공부 > TIL(Today I Learned)' 카테고리의 다른 글
TIL(Today I Learned) 91일차(24.03.14) (0) | 2024.03.14 |
---|---|
TIL(Today I Learned) 90일차(24.03.13) (0) | 2024.03.13 |
TIL(Today I Learned) 88일차(24.03.11) (0) | 2024.03.11 |
TIL(Today I Learned) 87일차(24.03.07) (0) | 2024.03.07 |
TIL(Today I Learned) 86일차(24.03.06) (0) | 2024.03.06 |